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内 容 简 介 


本 书 针对 计算 机 在 审计 中 数据 分 析 所 需要 的 技术 方法 和 工具 ,按照 技术 发 展 的 脉络 ,介绍 基于 关 
系数 据 库 的 以 结构 化 查询 语言 (SQL) 为 工具 的 查询 分 析 , 基 于 数据 仓库 的 可 视 化 途径 的 多 维 分 析 , 基 于 
模型 训练 的 机 器 学 习 途 径 的 挖掘 分 析 ,以 及 基于 大 数据 的 相关 分 析 ,力图 使 读者 能 够 应 用 本 书 介绍 的 方 
法 、 工 具 和 技术 完成 审计 目标 。 

全 书 共 有 7 章 。 第 1 章 介 绍 审计 数据 分 析 的 基本 概念 ;第 2 章 以 T-SQL 为 例 介 绍 结构 化 查询 语 
,包括 基本 的 DR、DDL、DML、DCL 等 ,以 及 结构 化 查询 语言 在 财务 审计 与 业务 数据 结合 的 财务 审计 
中 的 应 用 技术 ;第 3 章 介绍 数据 库 用 户 以 及 授权 数据 导入 导出 等 技术 ,以 及 这 些 技术 在 审计 中 的 应 用 ; 
第 4 章 介绍 高 级 查询 分 析 技 术 ,包括 游 标 、. 触 发 器 .视图 .索引 等 ;第 5 章 介绍 如 何 通 过 多 维 分 析 发 现 审 
计 线索 ;第 6 章 介 绍 数据 挖掘 途径 的 审计 数据 分 析 ; 第 7 章 介绍 基于 大 数据 的 审计 分 析 。 

本 书 可 作为 计算 机 审计 工作 者 的 技术 参考 书 。 
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PRANNOE 


2000 年 的 春天 ,河北 省 审计 厅 陈 金 如 副 厅 长 来 到 河北 师范 大 学 ,就 计算 机 教育 与 培 
训 问题 与 我 进行 了 第 1 次 “聊天 ”。 当 时 没有 想到 , 那 次 “聊天 ” 却 是 十 八 年 合作 的 开始 。 

当时 ,河北 省 审计 系统 面临 如 何 提 升 全 省 审计 工作 者 的 计算 机 审计 水 平 ,以 适应 信息 技术 
的 迅猛 发 展 问 题 。 从 事 审计 的 人 员 如 果 不 懂 信息 技术 ,那么 在 信息 化 环境 下 就 进 不 了 被 审 单 
位 的 门 , 打 不 开 被 审 单位 的 账 。 审 计 署 指出 ,开展 计算 机 审计 要 靠 审 计 人 员 素 质 的 提高 , 靠 审 
计 机 关 知 识 结构 的 改善 。 根 据 审计 署 的 要 求 ,河北 省 审计 厅 认 为 计算 机 审计 的 发 展 和 审计 事 
业 的 发 展 已 经 密 不 可 分 ,应 从 事 关 全 省 审计 事业 发 展 的 高 度 思考 计算 机 审计 问题 ,强力 推进 计 
算 机 审计 。 应 切实 增强 危机 感 和 紧迫 感 ,下 大 力量 将 计算 机 辅助 审计 工作 搞 上 去 。 

2000 一 2005 年 ,我 应 邀 为 审计 厅 的 几 次 短期 培训 授课 。 从 2006 年 开始 ,河北 省 审计 
厅 每 年 都 与 河北 师范 大 学 联合 举办 “河北 省 审计 机 关 计 算 机 审计 中 级 培训 ”, 目 前 仍然 在 
进行 。 参 训 学 员 大 部 分 已 成 为 各 单位 审计 信息 化 工作 骨干 ,并 多 次 在 审计 署 组 织 的 AO 
应 用 实例 评选 和 计算 机 审计 专家 经 验 评选 中 获奖 。 

在 培训 项 目 中 ,我 不 仅 负责 组 织 工 作 , 而 且 主 讲 了 “数据 库 应 用 技术 ”审计 数据 高 级 
分 析 技 术 ” 两 门 课程 。 为 了 把 审计 业务 与 计算 机 技术 结合 起 来 ,让 非 计算 机 专业 的 审计 师 
能 够 理解 ,掌握 和 应 用 计算 机 技术 ,在 省 审计 厅 安 排 下 ,我 还 深入 审计 现场 ,实地 调研 ,学 
习 审 计 业 务 , 了 解 审计 人 员 的 需求 ;钻研 审计 一 线 人 员 提 出 的 技术 问题 ,提出 解决 方案 ;不 
断 研究 数据 仓库 数据 挖掘 、 大 数据 等 技术 在 河北 省 计算 机 审计 业务 中 的 应 用 等 问题 ,并 
将 研究 结果 应 用 于 培训 。2014 年 , 受 河北 省 审计 厅 计 算 机 中 心 委托 ,编写 了 “技巧 系列 从 
书 ” 中 的 《数据 挖掘 技巧 ) 一 书 的 初稿 ,并 根据 审计 署 、 省 审计 厅 的 意见 进行 了 修改 ,于 
2017 年 出 版 。 十 八 年 来 累积 的 讲义 以 及 其 他 技术 资料 经 过 整理 ,形成 了 本 书 。 本 书 的 内 
容 不 仅 涉及 与 计算 机 审计 有 关 的 技术 ,还 包括 如 何 规避 常见 的 技术 错误 。 

本 书 初稿 由 河北 师范 大 学 的 董 东 老师 完成 。 河 北 师范 大 学 的 王 艳 君 . 陈 玉 哲 、 张 朝 昆 等 
老师 在 历年 培训 过 程 中 对 前 4 章 进行 过 修订 。 王 艳 君 对 本 书 的 章节 组 织 以 及 第 1 一 4 章 内 
容 提出 了 修改 意见 ; 陈 玉 哲 对 第 5 一 7 章 提 出 了 修改 意见 。 董 东 最 后 对 全 稿 进 行 了 精简 。 

本 书 得 到 河北 师范 大 学 应 用 开发 基金 (L2013K01) 和 河北 省 审计 厅 2018 年 重点 科研 
课题 (201805) 资 助 ,在 此 表示 感谢 。 

团 于 学 识 , 在 思想 ,方法 或 者 技术 等 方向 定 有 不 当 之 处 , 望 读者 批评 指正 。 


董 东 
2018 年 12 月 于 河北 师范 大 学 
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审计 数据 分 析 


数据 分 析 在 计算 机 科学 领域 和 统计 学 领域 已 经 被 广泛 关注 并 取得 了 大 量 研究 成 果 ， 
并 在 各 种 领域 已 经 得 到 广泛 应 用 以 解决 本 领域 的 具体 问题 ,如 商品 推荐 .交通 管理 .与 情 
分 析 等 。 

审计 是 对 业务 实体 经 济 活动 的 真实 性 、 合 法 性 和 效益 情况 的 验证 过 程 。 计 算 机 审 
计 是 以 计算 机 为 基本 工具 ,以 业务 系统 、 财 务 收 支 系统 电子 数据 为 主要 对 象 ,通过 计算 
机 软件 工具 的 功能 与 审计 人 员 经 验 判 断 的 结合 ,实现 对 业务 实体 经 济 活动 进行 真实 、 
合法 .效益 的 信息 化 审计 过 程 。 在 * 金 审 工程 "推动 下 ,我国 计算 机 审计 的 研究 和 应 用 
发 展 较 快 。 但是, 如何 应用 数据 分 析 技 术 有 效 地 实施 计算 机 审计 仍然 是 一 个 热点 
问题 。 

审计 数据 分 析 活 动 主 要 是 验证 (validation) 活动, 即 按照 政策 ,法规 对 反映 经 济 活动 
数据 项 或 者 数据 处 理 进 行 检查 ,以 查证 是 否 为 完全 按照 政策 ,法规 执行 的 活动 , 即 查证 被 
审 单位 是 否 正确 进行 了 经 济 活动 。 

随 着 信息 技术 的 普及 和 广泛 应 用 , 企 事业 单位 每 天 产生 的 经 济 业务 活动 均 能 够 以 不 
同形 式 被 各 种 各 样 的 信息 系统 记录 下 来 。 那 么 ,从 这 些 纷繁 复杂 而 且 大 量 的 数据 中 完成 
审计 任务 和 达到 审计 目标 成 为 当前 审计 领域 关注 的 重要 问题 之 一 。 本 书 讨论 从 数据 中 发 
现 审计 线索 的 相关 数据 分 析 概 念 .技术 和 方法 。 


1.1 审 1 


国务 院 设立 审计 机 关 , 对 国务 院 各 部 门 和 地 方 各 级 政府 的 财政 收 支 ,对 国家 的 财政 金 
融 机 构 和 企业 事业 组 织 的 财务 收 支 ,进行 审计 监督 。 审 计 机 关 通 过 客观 地 获取 和 评价 有 
关 经 济 活动 与 经 济 事项 认定 的 证 据 , 以 证 实 这 些 认定 与 既定 标准 的 符合 程度 ,并 将 结果 传 
达 给 有 关 使 用 者 。 

审计 的 主体 是 从 事 审 计 工 作 的 专职 机 构 或 专职 的 人 员 ,是 独立 的 第 三 者 ,如 国家 审计 
机 关 、 会 计 师 事务 所 及 其 人 员 。 审 计 的 客体 是 被 审计 单位 的 财政 财务 收 支 及 其 他 经 济 活 
动 。 审 计 的 基本 工作 方式 是 搜集 证 据 , 查 明 事 实 , 对 照 标准 ,做 出 好 坏 优 劣 的 判断 。 审 计 
的 主要 目标 不 仅 要 审查 评价 会 计 资 料及 其 反映 的 财政 财务 收 支 的 真实 性 和 合法 性 ,而且 
还 要 审查 评价 有 关 经 济 活动 的 效益 性 。 
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1.2 计算 机 审计 


计算 机 审计 是 以 计算 机 为 基本 工具 ,以 被 审 单位 的 财务 收 支 电 子 账 和 业务 系统 的 数 
据 库 为 主要 对 象 , 在 计算 机 软件 工具 的 辅助 下 结合 审计 人 员 经 验 ,对 业务 实体 经 济 活动 进 
行 的 真实 、 合 法 ,效益 的 信息 化 审计 过 程 。 计 算 机 审计 丰富 了 传统 审计 中 各 阶段 的 内 容 。 
一 个 计算 机 审计 项 目 主要 包括 3 个 阶段 : 准备 阶段 .实施 阶段 和 报告 阶段 。 

在 审计 准备 阶段 ,审计 人 员 和 信息 技术 人 员 需 要 到 被 审计 单位 了 解 信息 系统 、 业 务 过 
程 , 电 子 数据 等 状况 ;调查 系统 结构 、 业 务 处 理 流程 .数据 存储 结构 及 数据 处 理 流程 ;从 被 
审 单位 系统 采集 审计 相关 的 会 计 核 算数 据 和 业务 数据 ;将 数据 导入 审计 软件 ;验证 数据 的 
合法 性 有 效 性 与 完整 性 。 

在 审计 实施 阶段 ,根据 审计 人 员 经 验 和 相关 技术 方法 设计 模型 ,对 审计 数据 进行 查询 
分 析 、 多 维 分 析 或 者 发 掘 分析 ,发 现 审计 线索 。 然 后 寻找 疑点 ,落实 线索 形成 证 据 。 

在 审计 报告 阶段 ,形成 审计 报告 , 送 达 有 关 使 用 者 。 还 将 被 审 单位 系统 、 数 据 情况 ,以 
及 操作 流程 加 以 归档 , 供 以 后 审计 使 用 。 具 体 包括 : 被 审 单位 信息 系统 开发 及 应 用 情况 ; 
业务 流程 及 数据 流程 文档 ;与 审计 数据 相关 的 数据 结构 资料 ;本 次 审计 所 建立 、 应 用 的 审 
计 模 型 ,发 现 问题 的 方法 思路 及 编写 的 程序 或 操作 步 又。 


1.3 审计 数据 分 析 


根据 技术 和 模型 的 不 同 ,审计 数据 分 析 分 为 4 类 : 基于 数据 库 的 审计 分 析 、 基 于 数据 
仓库 的 审计 分 析 、 基 于 数据 挖掘 的 审计 分 析 和 基于 大 数据 的 审计 分 析 。 

基于 数据 库 的 审计 分 析 也 称 为 查询 型 分 析 , 指 建立 模型 \ 设 计 结 构 化 查询 语言 
(Structured Query Language，SQL) 语 句 查 询 数 据 库 、 分 析 查 询 结 果 的 过 程 。 查 询 型 分 
析 的 主要 对 象 是 关系 数据 库 管理 系统 中 的 表 , 涉 及 单 表 查 询 、 多 表 查 询 等 技术 。 一 个 成 功 
的 查询 分 析 既 需要 定义 一 个 很 好 的 业务 问题 ( 查 什 么 ) ,也 需要 设计 很 好 的 SQL 语句 (如 
何 查 ) 。 

当 需 要 从 不 同 角度 可 视 化 地 观察 某 个 时 期 . 某 个 主题 的 历史 数据 时 ,就 需要 应 用 基于 
数据 仓库 的 分 析 技 术 。 多 维 分 析 模 型 描述 了 如 何在 多 个 维 上 观察 业务 事实 。 事 实 是 一 组 
与 业务 事务 或 者 事件 相关 的 数据 项 。 例 如 ,会 计 事务 中 的 一 笔 任 证 就 是 一 个 事实 ,这 个 事 
实 中 含有 日 期 .凭证 类 型 .部 门 . 科 目 、 借 贷 金 额 等 数据 项 。 维 是 一 组 对 事实 进行 分 析 所 使 
用 的 属性 ,如 在 日 期 和 科目 属性 上 对 凭证 事实 进行 分 析 。 

很 多 情况 下 ,审计 活动 是 基于 经 验 的 。 经 验 是 审计 人 员 在 长 期 实践 中 经 过 归纳 推演 
发 现 的 一 些 特征 或 者 规律 。 基 于 数据 挖掘 的 分 析 指 先 由 计算 机 发 现 隐藏 在 数据 中 的 、 不 
为 审计 人 员 预 先 所 知 的 规则 、 规 律 ,模式 或 者 趋势 .然后 审计 人 员 对 这 些 发 现 的 计算 机 “经 
验 ” 进 行 甄 别 和 利用 。 

大 数据 指数 据 量 大 得 超出 了 常规 软件 的 管理 能 力 的 数据 。 大 数据 分 析 的 策略 不 同 于 
常规 数据 。 这 些 策略 有 基于 总 体 而 不 是 基于 抽样 ,基于 相关 而 不 是 基于 因果 ,等 等 。 


第 加 人 章 才 直 数据 分 本 


基于 关系 数据 库 的 审计 分 析 、 基 于 数据 仓库 的 审计 分 析 、 基 于 数据 挖掘 的 审计 分 析 和 
基于 大 数据 的 审计 分 析 一 起 构成 了 审计 数据 分 析 , 但 它们 有 各 自 的 适用 范围 。 基 于 关系 
数据 库 的 审计 分 析 是 已 知 数据 结构 的 情况 下 ,对 操作 型 数据 的 访问 ,比较 容易 建立 模型 ; 
基于 数据 仓库 的 审计 分 析 需 要 对 被 审 数据 重新 组 织 ,需要 从 不 同 角度 观察 数据 ,建立 模型 
较为 复杂 ;而 基于 数据 挖掘 的 审计 分 析 需 要 审计 人 员 根 据 具体 业务 问题 选取 合适 的 挖掘 
模型 ,从 而 在 数据 挖掘 工具 帮助 下 发 现 有 用 模式 和 趋势 ,处 于 高 级 的 分 析 层 次 ;基于 大 数 
据 的 审计 分 析 的 关键 是 获取 数据 的 总 体 , 有 了 总 体 ,就 可 以 用 简单 的 模型 解决 复杂 的 
问题 。 


1.3.1 基于 关系 数据 库 的 审计 分 析 


从 集合 角度 看 ,关系 (relation) 是 元 组 (tuple) 的 集合 。 一 个 元 组 中 有 若干 属性 
Cattribute) 值 。 在 关系 中 能 唯一 标识 一 个 元 组 的 属性 集 称 为 关系 的 超 键 (super key) 。 不 
含 多 余 属 性 的 超 键 称 为 候选 键 (candidate key) 。 一 个 关系 中 可 能 存在 多 个 候选 键 , 用 户 
选 作 元 组 标识 的 候选 键 称 为 主键 (primary key) 。 

例如 ,有 关系 : 医生 (医生 号 ,姓名 ,性 别 ,年 龄 ,职称 ,身份 证 号 ,部 门 号 ), 其 中“ 医生” 
是 关系 的 名 称 ;医生 号 、 姓 名 、 性 别 \ 年 龄 职称、 身份 证 号 、 部 门 号 是 该 关系 的 属性 。 这 些 
属性 中 ,医生 号 和 姓名 两 个 属性 一 起 可 以 作为 超 键 ,姓名 和 身份 证 号 这 两 个 属性 一 起 也 是 
超 键 。 而 医生 号 是 候选 键 ,身份 证 号 也 是 候选 键 。 可 以 把 “医生 号 ”作为 主键 ,也 可 以 把 
“身份 证 号 ”作为 主键 ,但 一 个 关系 上 只 能 有 一 个 主键 。 

关系 的 属性 值 不 可 分 解 , 从 而 不 允许 表 中 有 表 ; 一 个 关系 中 的 元 组 不 可 重复 ;关系 是 
元 组 的 集合 ,集合 的 元 素 是 无 序 的 ;属性 之 间 也 无 序 。 

在 关系 上 可 以 施加 3 类 完整 性 约束 : 实体 完整 性 (entity integrity)、 参 照 完整 性 
(referential integrity) 和 用 户 定义 的 完整 性 。 


1. 实体 完整 性 


若 属性 A 是 关系 R 主键 中 的 属性 , 则 属性 A 不 能 取 空 值 。 一 个 元 组 对 应 现实 世界 
的 一 个 实体 ,一 个 关系 对 应 现实 世界 的 一 个 实体 集 。 现 实 世 界 中 的 实体 是 完整 的 , 即 每 个 
实体 都 具有 属性 值 。 而 在 关系 中 不 可 能 穷尽 所 有 的 属性 ,只 能 有 感 兴趣 的 部 分 属性 。 无 
法 要 求 这 部 分 属性 都 必须 有 属性 值 .但 可 以 要 求 主键 必须 有 值 , 即 不 能 取 空 值 (NULL)。 
所 谓 空 值 ,就 是 “不 知道 ”或 “无 意义 ”的 值 。 如 果 主 键 中 的 属性 取 空 值 ,就 说 明 存 在 某 个 不 
可 标识 的 实体 , 即 存在 不 可 区 分 的 实体 。 例 如 ,医生 (医生 号 ,姓名 ,年 龄 ,身份 证 号 ) 中 ,如 
果 医 生 号 为 主键 , 则 该 属性 不 能 取 空 值 。 


2 参照 完整 性 


设 下 是 关系 R 的 一 个 或 一 组 属性 ,但 不 是 关系 R 的 键 ,如 果 下 与 关系 S 的 主键 对 应 , 则 
称 下 是 关系 R 的 外 键 (foreign key)。 例 如 ,医生 (医生 号 ,姓名 ,部 门 号 ) 和 部 门 (编号 ,名 称 ， 
级 别 ) 两 个 关系 “部门 号 "是 医生 关系 模式 的 外 键 ,对 应 于 “部 门 ”关系 的 属性 “编号 ”。 

若 属性 (或 属性 组 )F 是 关系 R 的 外 键 , 它 与 关系 S 的 主键 对 应 (关系 R 和 S 可 能 是 
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同一 个 关系 ) , 则 对 于 R 中 每 个 元 组 在 F 上 的 值 都 必须 或 者 取 空 值 (F 的 每 个 属性 值 均 为 
空 值 ) ,或 者 等 于 S 中 某 个 元 组 的 主键 值 。 

例如 ,对 于 “医生 ”关系 中 的 每 个 元 组 ,其 在 “部 门 号 ”上 的 取 值 要 么 是 空 值 ,要 么 是 “部 
门 ? 关 系 中 某 一 元 组 在 “编号 ?属性 上 的 值 。 也 就 是 说 , 某 个 医生 所 在 的 部 门 必须 是 存在 的 
一 个 部 门 。 

在 “医生 ”和 “部 门 ”这 两 个 关系 中 ,为 了 维护 参照 完整 性 ,删除 “部 门 ”关系 中 的 元 组 时 
可 以 采用 3 种 策略 : 级 联 删除 ` 级 联 受 限 删除 和 置 空 值 删除 。 例 如 ,删除 部门 ?关系 中 的 
10101 部 门 ,级 联 删除 是 将 关系 "医生 ”中 所 有 部 门 号 (外 键 ) 为 10101 的 元 组 删除 ,接着 将 
关系 “部 门 ” 中 键 为 10101 的 元 组 也 删除 ; 受 限 删除 是 当 关系 “医生 ”中 没有 任何 元 组 的 部 
门 号 (外 键 ) 为 10101 时 , 才 执 行 删除 操作 ,否则 拒绝 删除 ; 置 空 值 删除 则 将 关系 “医生 ”中 
部 门 号 (外 键 ) 为 10101 的 元 组 的 部 门 号 置 空 , 然 后 删除 关系 “部 门 ”中 键 为 10101 的 元 组 。 

如 果 要 在 关系 “医生 ”中 插入 元 组 ,其 “部 门 号 "在 “部 门 ”关系 中 存在 , 则 插入 操作 可 以 
顺利 执行 ;如 果 不 存 在 相应 的 元 组 , 则 可 以 有 两 种 策略 : 受 限 插入 和 递归 插入 。 前 者 拒绝 
在 “医生 "关系 中 插入 元 组 ;后 者 首先 向 “部 门 ”关系 中 插入 相应 的 元 组 ,其 编号 (主键 ) 值 等 
于 “医生 "关系 插入 元 组 的 部 门 号 (外 键 ) 值 ,然后 向 参照 关 系 中 插入 元 组 。 


3 用 户 定义 的 完整 性 


用 户 定义 的 完整 性 就 是 针对 某 一 具体 关系 数据 库 的 约束 条 件 , 它 反映 某 一 具体 应 用 
涉及 的 数据 必须 满足 的 语义 要 求 。 关 系数 据 库 的 实现 提供 定义 和 检验 这 类 完整 性 的 机 
制 ,以 便 用 统一 的 、 系 统 的 方法 处 理 它们 ,而 不 要 由 应 用 程序 承担 这 一 功能 。 例 如 ,约束 
“年 龄 "属性 是 0 一 200 的 一 个 整数 。 

数据 库 (database) 是 数据 的 汇集 , 它 以 某 种 组 织 形式 存储 在 介质 上 。 数 据 库 管理 系 
统 (Database Management System,DBMS) 是 管理 数据 库 的 系统 软件 。 从 操作 系统 角度 
看 ,数据 库 表现 为 一 个 或 一 组 特定 扩展 名 的 文件 。 例 如 ,一 个 Access 数据 库 是 一 个 扩展 
名 为 . mdb 的 文件 ,再 如 ,一 个 SQL Server 2008 的 数据 库 在 最 简单 的 情况 下 由 两 个 文件 
构成 ,一 个 文件 的 扩展 名 为 . mdf, 另 一 个 文件 的 扩展 名 为 . ldf 。 

按照 关系 模型 实现 的 数据 库 关 系 系统 称 为 关系 数据 库 管 理 系统 。 目 前 广泛 使 用 的 数 
据 库 管理 系统 有 甲骨 文公 司 的 Oracle、Microsoft 公司 的 SQL Server、IBM 公司 开发 的 
DB2 以 及 开源 数据 库 MySQL 等 。 由 于 大 多 数 的 数据 库 管 理 系统 产品 都 是 关系 模型 的 实 
现 ,所 以 后 文中 的 “数据 库 管理 系统 "默认 指 “ 关 系数 据 库 管理 系统 ”。 

图 1-1 展示 了 关系 模型 中 的 术语 与 关系 数据 库 中 的 术语 对 应 关系 。 

从 图 1-1 中 可 以 看 到 ,一 个 关系 对 应 数据 库 中 的 一 个 表 ; 若 干 关 系 组 成 关系 模式 , 若 
干 表 形成 数据 库 模 式 ;一 个 元 组 对 应 表 中 的 一 行 , 元 组 在 某 个 属性 上 的 值 对 应 行 在 某 个 列 
上 的 值 。 

数据 库 管理 系统 的 主要 功能 有 : 定义 数据 库 ,操纵 数据 控制 数据 库 和 维护 数据 库 。 

1) 定义 数据 库 

DBMS 提供 数据 描述 语言 (Data Definition Language, DDL), 定 义 数据 的 结构 、 数 据 
与 数据 间 的 关系 数据 的 完整 性 约束 等 。 数 据 库 中 的 主要 对 象 是 表 (table) ,数据 组 织 在 
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关系 模型 中 的 术语 。 关系 数据 库 中 的 术语 


部 门 2 性 列 
部 门 号 | 部 门 名 | 部 门 电话 = 一 一 关系 模式 数据 库 模式 
001 “| 财务 部 | 86653541 | 一 一 一 ”元 组 1 行 1 
002 “| 销售 部 | 86268345 [一 一 一 元 组 2 | 行 2 
003 | 客户 部 | 86268428 | 一 一 一 元 组 3 行 3 
出 # 值 列 值 


图 1-1 关系 模型 中 的 术语 与 关系 数据 库 中 的 术语 对 应 关系 


表 中 。 数 据 的 完整 性 约束 既 可 以 定义 在 表 上 ,也 可 以 定义 在 表 之 间 。 数 据 库 中 的 表 约束 
等 对 象 合 起 来 称 为 数据 库 模式 (schema) 。 

2) 操纵 数据 

DBMS 提供 数据 操纵 语言 (Data Manipulation Language,DML) ,可 实现 对 数据 的 查 
询 、 插 入 删除 和 修改 等 操作 。DML 有 两 种 用 法 : 一 种 方法 是 把 DML 语句 嵌入 到 高 级 语 
言 中 ; 另 一 种 方法 是 交互 式 地 使 用 DML 语句 。 对 于 第 一 种 方法 ,DBMS 必须 提供 预 编译 
程序 , 预 处 理 庶 入 DML 语句 的 源 程序 ,识别 DML 语句 ,转换 为 相应 高 级 语言 能 调用 的 语 
名 ,以便 原来 的 编译 程序 能 接受 和 人 处理 它 们 。 

3) 控制 数据 库 

数据 库 的 控制 功能 包括 并 发 控制 .数据 的 安全 性 控制 .数据 的 完整 性 控制 和 权限 控 
制 , 保 证 数据 库 系统 正确 有 效 地 运行 。 

4) 维护 数据 库 

已 经 建立 好 的 数据 库 , 在 运行 过 程 中 需要 进行 维护 。 维 护 功 能 包括 数据 库 出 现 故 障 
后 的 恢复 ,数据库 的 重 构 ,性 能 的 监视 等 。 这 些 功 能 大 部 分 由 实用 程序 完成 。 

数据 字典 (Data Dictionary ,DD) 中 存放 着 数据 库 体 系 结构 的 描述 。 对 于 用 户 的 一 个 
处 理 请 求 ,DBMS 都 要 查阅 数据 字典 。 

当 应 用 程序 需要 处 理 数据 库 中 的 数据 时 ,首先 向 数据 库 管 理 系统 发 送 一 个 数据 处 理 
请 求 ,数据 库 管理 系统 接收 到 这 一 请 求 后 ,对 其 进行 分 析 ,然后 执行 数据 操作 ,并 把 操作 结 
果 返 回 给 应 用 程序 。 由 于 应 用 程序 直接 与 用 户 打交道 ,而 数据 库 管理 系统 不 直接 与 用 户 
打交道 ,所 以 前 者 常 被 称 为 “前 台 ”, 后 者 常 被 称 为 “后 台 ”。 

由 于 应 用 程序 是 向 数据 库 管理 系统 提出 服务 请 求 ,通常 称 为 客户 机 (Client) 程 序 , 而 
数据 库 管 理 系统 是 为 其 他 应 用 程序 提供 服务 ,通常 称 为 服务 器 (Server) 程 序 , 所 以 又 将 这 
种 实现 模式 称 为 客户 机 /服务 器 (C/S) 模 式 。 

对 于 一 个 应 用 系统 ,需要 有 哪些 表 ? 表 之 间 是 什么 关系 ? 即 如 何 设 计数 据 库 模式 ? 
数据 库 模式 一 般 从 概念 模型 得 到 。 

概念 模型 用 于 信息 世界 的 建 模 。 概 念 模型 不 依赖 于 具体 的 计算 机 系统 。 概 念 模型 可 
以 转换 为 计算 机 上 某 一 DBMS 支持 的 特定 数据 模型 。 

在 概念 模型 中 ,客观 存在 并 可 相互 区 别 的 事物 称 为 实体 (entity)。 实 体 可 以 是 具体 的 
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人 .事物 ,也 可 以 是 抽象 的 概念 或 联系 。 例 如 ,医院 中 的 一 名 医生 、 一 个 部 门 都 是 实体 。 
实体 具有 的 某 一 特性 称 为 属性 (attribute) 。 一 个 实体 可 以 由 若干 个 属性 刻画 。 例 如 ,要 
在 数据 库 系统 中 记录 一 名 医院 的 医生 ,可 以 包括 一 组 属性 : 医生 号 、 姓 名、 性 别 、 年 龄 、. 职 
称 、 身 份 证 号 等 ;要 记录 一 个 凭证 ,可 以 用 凭证 号 、 借 方 发 生 额 \ 贷 方 发 生 额 等 属性 。 属 性 
的 取 值 范围 称 为 该 属性 的 域 (domain)。 

唯一 标识 一 个 实体 的 属性 集 称 为 键 (key) 。 键 是 一 个 属性 集 ,属性 集 可 能 由 单个 属性 
构成 ,也 可 能 由 多 个 属性 构成 。 例 如 ,医院 中 ,“ 医 生 号 ”可 以 作为 “医生 ”的 键 ,这 时 键 由 单 
个 属性 构成 ;要 标识 一 张 火车 票 , 则 需要 日 期 车 次 .车 厢 、 座 位 号 ,这 时 键 由 一 组 属性 构 
成 。 键 的 确定 是 一 个 语义 范畴 的 问题 。 实 体 可 能 同时 存在 多 个 键 。 例 如 ,医生 号 ?可 以 
作为 医生 的 键 ,而 “身份 证 号 ”也 可 以 作为 医生 的 键 。 当 实体 有 多 个 键 时 , 选 其 中 一 个 键 作 
为 主键 。 

用 实体 名 及 其 属性 名 集合 抽象 和 刻画 同类 实体 , 称 为 实体 型 (entity type)。 例 如 , 医 
生 的 实体 型 可 以 表示 为 : 医生 (医生 号 .姓名 ,性 别 , 年 龄 ,职称 ,身份 证 号 ) ,属性 之 间 用 去 
号 隔 开 。 同 型 实体 构成 的 集合 称 为 实体 集 (entity set) 。 

现实 世界 中 ,事物 内 部 以 及 事物 之 间 的 联系 在 信息 世界 中 反映 为 实体 内 部 的 联系 和 
实体 之 间 的 联系 (relationship)。 两 个 实体 集 之 间 的 联系 有 3 种 类 型 : 一 对 一 联系 、 一 对 
多 联系 和 多 对 多 联系 。 

如 果 对 于 实体 集 A 中 的 每 一 个 实体 ,实体 集 B 中 至 多 有 一 个 实体 与 之 联系 ,反之 亦 
然 , 则 称 实体 集 A 与 实体 集 B 具有 一 对 一 联系 , 记 为 1 : 1。 例 如 ,一 份 审计 报告 只 涉及 一 
个 审计 项 目 , 而 一 个 审计 项 目 最 终 产生 一 份 审计 报告 。 

如 果 对 于 实体 集 A 中 的 每 一 个 实体 ,实体 集 B 中 及 个 实体 (x 宇 0) 与 之 联系 ,反之 ， 
对 于 实体 集 B 中 的 每 一 个 实体 ,实体 集 A 中 至 多 只 有 一 个 实体 与 之 联系 , 则 称 实体 集 A 
与 实体 集 B 有 一 对 多 联系 , 记 为 1 : n。 例 如 ,处 室 和 工作 人 员 的 联系 。 一 个 处 室 中 有 若 
干 工作 人 员 ,一 个 工作 人 员 至 多 在 一 个 处 室 中 工作 ,由 处 室 到 工作 人 员 是 一 对 多 联系 。 需 
要 注意 的 是 ,一 对 多 联系 不 是 对 称 的 ,由 处 室 到 工作 人 员 是 一 对 多 联系 , 反 过 来 ,由 工作 人 
员 到 处 室 是 多 对 一 联系 。 

如 果 对 于 实体 集 A 中 的 每 一 个 实体 ,实体 集 B 中 及 n 个 实体 (n 宇 0) 与 之 联系 ,反之 ， 
对 于 实体 集 B 中 的 每 一 个 实体 ,实体 集 A 中 也 有 m 个 实体 (m 宇 0) 与 之 联系 , 则 称 实体 集 
A 与 实体 集 B 具 有 多 对 多 联系 。 记 为 m : n。 例 如 ,审计 小 组 和 工作 人 员 的 联系 。 一 个 
审计 小 组 由 多 个 工作 人 员 组 成 ;一 个 工作 人 员 可 以 参加 多 个 审计 小 组 。 再 如 ,一 个 审计 小 
组 可 以 负责 多 个 审计 项 目 ; 一 个 审计 项 目 可 以 由 多 个 审计 小 组 负责 。 

实体 -关系 图 (E-R 图 ) 提 供 了 表示 实体 型 .属性 和 联系 的 可 视 化 方法 。 在 E-R 图 中 ， 
使 用 矩形 表示 实体 型 ,矩形 框 内 写 明 实体 名 。 例 如 ,表示 医院 的 医生 和 部 门 : 


用 椭圆 表示 属性 ,并 用 无 向 边 将 其 与 相应 的 实体 连接 起 来 。 例 如 ,医生 和 部 门 的 属性 


表示 如 图 1-2 所 示 。 
使 用 菱形 表示 联系 .菱形 框 内 写 明 联系 名 .并 用 无 向 边 分 别 与 有 关 实 体 集 连接 起 来 ， 
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ER 


同时 在 无 向 边 上 标记 联系 的 类 型 (1 : 1、1 : n 或 m : n)。 例 如 ,医生 和 部 门 的 联系 如 
图 1-3 所 示 。 


(医生 号 )( 性 别 ) (年龄 ) ( 身份 证 号 ) 


职称 


人 医生 号 )( 性 别 ) ( 年 哈 ) ( 身份 证 号 ) 站 
! 
人 部] 号) (部 ] 名 ) 人 部门 号 ) (人 部 站 名 ) 
图 1-2 属性 图 1-3 联系 


联系 本 身 也 是 一 种 实体 型 ,也 可 以 有 属性 。 如 果 一 个 联系 具有 属性 , 则 这 些 属性 也 要 
用 椭圆 形 表示 ,并 用 无 向 边 与 该 联系 连接 起 来 。 

联系 存在 于 两 个 实体 之 间 , 也 可 以 存在 于 3 个 实体 之 间 。 例 如 ,一 次 住院 收费 涉及 3 
个 实体 : 医生 、 患 者 和 收费 项 目 ,可 以 用 图 1-4 描述 这 三 者 之 间 的 联系 。 


医生 < > 患者 


收费 项 目 


图 1-4 住院 收费 之 间 的 联系 


图 1-5 展示 了 两 个 实体 集 之 间 每 种 联系 的 E-R 图 表示 方法 。 


实体 集 A 实体 集 A 实体 集 A 
1 1 m 
l n n 
实体 集 B 实体 集 B 实体 集 B 
(a) 1:1 联系 (b) 1:n 联系 (c) m:n 联系 


图 1-5 3 种 联系 的 表示 


通常 将 实体 集 及 实体 集 间 联系 的 上 述 表示 模型 称 为 实体 -关系 (relationship) 模 型 ;从 
分 析 用 户 项 目 涉及 的 对 象 及 对 象 之 间 的 联系 出 发 ,到 获取 E-R 图 的 这 一 过 程 称 为 概念 模 
型 设计 。 

查询 型 分 析 指 通过 结构 化 查询 语言 (Structured Query Language，SQL) 形 成 SQL 
语句 交互 式 查询 数据 库 的 过 程 。 查 询 型 分 析 的 主要 对 象 是 数据 库 管 理 系统 中 的 表 。 运 用 
SQL 语句 进行 有 关 数 据 采集 数据 预 处 理 和 数据 分 析 在 我 国 面向 数据 的 计算 机 辅助 审计 


二 动 分 本 : 内 的 国 到 央 上 旺 


中 的 应 用 十 分 广泛 ,出 现 了 大 量 成 功 的 案例 。 数 据 查询 语句 ,包括 单 表 查询 、 面 向 多 表 的 
连接 查询 和 柑 套 查询 是 实现 查询 分 析 的 主要 技术 。 其 他 技术 还 有 : 使 用 行 选择 条 件 、 分 
组 、 分 组 选择 条 件 .排序 .选择 前 若干 行 查询 结果 等 ;使 用 统计 函数 进行 全 表 统计 和 分 组 统 
计 ; 将 多 个 查询 语句 的 结果 合并 为 一 个 结果 ;如 何 将 查询 结果 保存 在 永久 表 和 临时 表 中 
等 。 另 外 还 有 使 用 插 和 语句 、 数 据 更 新 语句 和 数据 删除 语句 进行 数据 操纵 。 

查询 型 分 析 的 技术 要 点 是 SQL。 而 应 用 SQL 解决 实际 问题 的 前 提 是 理解 关系 模型 
和 关系 数据 库 模 式 。 


1.3.2 基于 数据 仓库 的 审计 分 析 


数据 仓库 就 是 面向 主题 的 、 集 成 的 .相对 稳定 的 数据 集合 。 主 题 是 关注 的 问题 ,一 个 
主题 对 应 一 个 宏观 的 分 析 领 域 。 数 据 仓库 中 的 数据 是 从 原 有 分 散 的 面向 联机 事务 处 理 的 
数据 库 中 抽取 出 来 的 。 巾 于 数据 仓库 的 每 一 主题 对 应 的 源 数据 在 原 有 分 散 的 数据 库 中 可 
能 有 重复 或 不 一 致 的 地 方 , 因 此 数据 在 进入 数据 仓库 之 前 必须 经 过 数据 的 抽取 清洗 和 转 
换 。 数 据 仓库 中 存放 的 是 历史 数据 ,而 不 是 日 常事 务 处 理 产 生 的 数据 ,数据 进入 数据 仓库 
后 极 少 甚至 根本 不 被 修改 。 

多 维 数据 模型 提供 了 多 角度 、 多 层次 的 分 析 应 用 ,如 基于 时 间 维 、 地 域 维 等 构建 星 形 
模型 或 者 雪花 模型 ,可 以 实现 在 各 时 间 维 度 和 地 域 维度 的 交叉 查询 。 多 维 分 析 技 术 以 及 
分 类 技术 . 聚 类 技术 等 数据 挖掘 技术 已 经 开始 应 用 于 审计 分 析 中 。 多 维 分 析 途 径 的 计算 
机 审计 过 程 如 图 1-6 所 示 。 


识别 审计 目标 
1 
形成 思路 ， 采 集 、 清 洗 、 转 换 、 验 证 待 审 数据 集 


L 


设计 多 维 分 析 模 型 


1 
实施 多 维 分 析 ， 发 现 疑 点 


® 


图 1-6 多 维 分 析 途 径 的 计算 机 审计 过 程 


例如 ,税务 机 关 可 以 批准 企业 延期 纳税 ,一 个 可 能 的 审计 目标 是 查证 有 无 违法 批准 延 
期 纳税 的 疑点 。 于 是 审计 人 员 设 想 ,能 否 从 若干 税种 中 选 定 一 个 常见 的 税种 ,如 “企业 所 
得 税 ”, 然 后 从 若干 税务 机 关中 选择 一 个 或 者 若干 个 ,观察 这 些 税务 机 关 在 某 年 某 月 某 日 
的 纳税 额 ,从 企业 缴纳 的 时 间 ,数额 特征 中 寻找 线索 ,这 就 是 审计 思路 。 

有 了 思路 ,就 按照 这 个 思路 从 税务 机 关 采 集 、 清 洗 和 转换 数据 ,存储 到 数据 库 或 者 数 
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第 中意 坤 赴 数 所 分析 


据 仓库 中 ,整理 成 事实 表 。 然 后 设计 多 维 分 析 模 型 。 想 法 中 的 “税种 ”税务 机 关 ” 和 * 日 
期 "就 是 多 维 分 析 模 型 中 的 3 个 “ 维 ”; 而 纳税 额 就 是 多 维 分 析 模 型 中 的 “度量 值 ”。 

建立 好 多 维 分 析 模 型 后 ,应 用 软件 工具 以 多 维 方 式 浏览 数据 ,观察 可 疑 模 式 , 发 现 审 
计 疑 点 。 


1.3.3 基于 数据 挖掘 的 审计 分 析 


从 审计 角度 看 ,数据 挖掘 就 是 根据 事先 明确 的 审计 目标 ,对 被 审 单位 的 大 量 业务 数据 
进行 分 析 ,揭示 其 中 潜在 的 逻辑 关系 和 规律 ,进而 O 
形成 明确 而 有 效 的 审计 思路 的 过 程 。 例 如 ,银行 


1 
贷款 五 级 分 类 真实 性 情况 审计 。 由 于 种 种 原因 ， 


定义 审计 业务 问题 
某 些 事实 上 的 不 良 贷款 (次 级 可疑 或 损失 ) 被 商 
业 银行 人 为 划 归 正常 贷款 分 类 (正常 或 关注 ) 中 。 (一 
制定 审计 方法 


按照 传统 的 审计 思路 ,需要 与 被 审 单位 了 解 贷款 
五 级 分 类 规则 ,然后 根据 被 审 单位 提供 的 规则 逐一 一 二 一 
一 核实 各 笔 贷款 的 分 类 是 否 正确 。 挖 气 型 分 析 途 。 | 玫 集 、 清洗、 转换 验证 待 审 数据 集 
径 是 先 让 计算 机 从 被 审 单位 提供 的 大 量 无 错误 分 
类 的 贷款 数据 中 学 习 到 贷款 五 级 分 类 规则 ,然后 设计 、 训 练 和 评估 数据 挖掘 模 型 
应 用 该 规则 到 被 审 贷款 数据 集 上 ,从 而 发 现 审计 1 
线索 。 应 用 数据 挖掘 模型 发 现 疑点 
数据 挖掘 途径 的 计算 机 审计 过 程 如 图 1-7 1 
所 示 。 图 
“对 某 省 某 商业 银行 商业 贷款 进行 五 级 分 类 图 1-7 数据 挖掘 途径 的 计算 机 审计 过 程 
真实 性 核实 ?就 是 一 个 审计 目标 。 为 了 完成 这 个 
目标 ,首先 采集 清洗 和 转换 商业 贷款 以 及 五 级 分 类 情况 的 数据 。 因 为 这 是 数据 挖掘 中 的 
“分 类 "问题 ,所 以 选择 某 种 分 类 学 习 算法 ,如 决策 树 算法 ,在 具有 分 类 标签 的 无 错误 分 类 
的 数据 集 上 学 习 分 类 规则 ,并 对 学 习 到 的 分 类 规则 进行 评估 。 如 果 评估 认为 机 器 学 习 到 
的 分 类 规则 与 实际 的 分 类 规则 具有 较 高 的 一 致 性 , 则 应 用 分 类 规则 到 可 能 具有 错误 分 类 
的 商业 贷款 事例 上 , 即 应 用 规则 重新 对 这 些 商业 贷款 事例 进行 分 类 。 重 新 分 类 得 到 类 标 
签 与 原来 的 类 标签 不 一 致 的 事例 就 形成 了 审计 疑点 。 


1.3.4 基于 大 数据 的 审计 分 析 


审计 数据 获取 数据 可 视 化 技术 、 审 计 人 员 能 力 提升 是 当前 审计 行业 共同 关注 的 问 
题 。 如 今 , 大 数据 环境 为 审计 工作 提供 了 总 体 数据 ,使 得 审计 全 覆盖 成 为 可 能 。 

大 数据 背景 下 ,审计 工作 的 展开 是 数据 导向 的 ,将 会 形成 自 顶 向 下 、 逐 渐 细 化 的 工作 
模式 : 总 体 把 握 一 发 现 疑 点 一 分 散 核实 。 在 大 量 数 据 中 进行 可 视 化 分 析 , 以 把 握 总 体 、 数 
据 挖掘 分 析 ,以 发 现 要 点 ,从 大 量 数据 中 发 现 审计 重点 ` 疑 点 ,更 加 有 针对 性 地 开展 现场 审 
计 , 提 升 审计 效率 。 

当 数 据 集 的 规模 超出 了 传统 数据 库 软 件 的 管理 和 分 析 能 力 , 通 常 达到 几 十 TB, 甚 至 


恒 团 鲍 而 : 风 的 国 轩 内 蜗 的 


几 个 PB 规模 时 ,被 称 为 “大 数据 ”大 数据 有 3 个 基本 特征 : 体 量 (volume) 大 、 流 动 
(velocity) 快 和 多 样 性 (variety) 。 随 着 物 联 网 技术 、 互 联网 技术 不 断 深入 人 类 社会 的 各 个 
角落 ,人 类 的 社会 活动 ,无 论 是 步行 过 马路 、 还 是 驾车 过 道口 ;无 论 是 使 用 社交 软件 聊天 ， 
还 是 网 上 浏览 购物 ;无 论 是 使 用 网 约 车 出 行 ,还 是 到 外 地 住宿 餐饮 ,这 些 行为 都 被 以 各 种 
各 样 形式 记录 下 来 归结 到 一 起 ,就 形成 了 大 数据 。 

大 数据 为 审计 提供 了 全 覆盖 的 机 遇 , 也 提出 了 新 的 挑战 : 如 何 从 大 体 量 的 、 纷 繁复 杂 
的 经 济 活动 中 发 现 审 计 疑 点 和 审计 线索 。 例 如 ,如 何 从 海量 贷款 示例 中 查找 出 异常 贷款 ? 

“ 自 顶 向 下 、 逐 层 细 化 "是 基于 大 数据 审计 分 析 的 一 种 策略 , 即 先 把 握 总 体 ;然后 发 现 
疑点 , 即 找到 突破 口 ;最 后 定位 事项 ,分 散 核 实 , 归 结 证 据 。 

把 握 整 体 就 是 借助 可 视 化 的 数据 分 析 工 具 选 取 关键 的 业务 、 财 务 特征 ,以 二 维 或 多 维 
形式 对 审计 数据 进行 多 维度 可 视 化 分 析 ,观测 被 审计 数据 在 时 间 、 空 间 上 的 分 布 以 及 变化 
趋势 ;比较 同比 、 环 比 的 变化 ,发 现 大 的 波动 ,确定 主题 ,在 整体 和 宏观 层面 上 通过 观察 发 
现 规 律 , 寻 找 异 常 。 

把 不 同 部 门 的 不 同 主题 的 数据 关联 起 来 ,使 用 适当 的 特征 ,利用 结构 化 查询 技术 或 者 
数据 挖掘 技术 发 现 疑 点 。 例 如 ,城乡 低 保 资 金管 理 使 用 合 规 情况 审计 来 说 ,从 不 动产 登 
记 、 公 安 户 籍 管理 等 多 个 部 门 采集 数据 ,与 低 保 数 据 进行 关联 ,可 以 查 出 死亡 胃 领 低 保 金 、 
不 符合 条 件 领 取 低 保 金 .重复 享受 城乡 低 保 待遇 等 问题 。 

最 后 ,根据 疑点 逐一 分 散 调查 取证 ,进行 核实 。 


1.3.5 审计 方法 模型 


无 论 采用 何 种 技术 进行 计算 机 审计 ,在 定义 目标 之 后 都 要 确定 审计 思路 ,制定 审计 方 
法 。 数 据 流程 图 是 对 某 一 计算 机 审计 思路 的 图 形 表 示 , 图 中 的 符号 包括 三 类 。 

(1) 表示 数据 存储 的 数据 符号 。 

(2) 表示 对 数据 执行 某 种 操作 的 处 理 符号 。 

(3) 表示 处 理 步骤 或 数据 间 数 据 流向 的 流 线 符 号 。 

图 1-8 是 一 个 数据 流程 图 样 例 。 虚 线 框 中 的 文字 是 对 流程 图 中 各 个 符号 含义 的 
说 明 。 

流 线 指示 数据 流 或 控制 流 。 流 线 可 以 有 箭头 ,表示 数据 流 或 者 控制 流 的 方向 。 控 制 
流 指示 先 做 什么 ,后 做 什么 。 更 为 具体 的 符号 参见 (计算 机 审计 方法 流程 图 编制 规范 一 一 
计算 机 审计 实务 公告 第 12 号 》。 

绘制 数据 流程 图 时 ,应 注意 以 下 几 点 : 

(1) 在 处 理 符号 的 前 后 都 应 是 数据 符号 。 

(2) 在 图 中 应 对 各 个 符号 均匀 地 分 配 空间 , 连 线 应 保持 合理 长 度 ,尽量 少 使 用 长 线 。 
保持 图 在 整体 上 左右 对 称 。 

(3) 使 用 各 种 符号 时 必须 按照 规范 所 给 符号 的 形状 ,尤其 不 要 改变 角度 和 其 他 影响 
符号 形状 的 因素 ,统一 各 种 符号 的 大 小 、 粗 细 等 样式 。 

(4) 把 理解 某 个 符号 的 功能 所 需要 的 最 低 限 度 的 说 明 性 文字 置 于 符号 内 。 文 字 应 该 
按 从 左 至 右 和 自 上 向 下 的 方式 书写 ,与 流向 无 关 。 若 说 明 性 文字 的 篇 幅 很 大 而 不 便 放 进 
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| 被 审 单位 原始 数据 。 | 
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六 1 1 数据 库 表 | 
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总 体 阅读 分 析 可 研 报 1 各 类 纸 质 文书 | 
告 内 容 ， 了 解 项 上 建 | | rr 
设 范围 内 容 , 提取 可 | 一 -=====-----| bpp re 
太夫 刘 名 分 项 没 资 多 | 二 1 人 IA 理 | 
的 
1 审计 分 析 结果 数据 。 “| 


决策 延伸 调查 ， 
得 出 审计 结论 


图 1-8 数据 流程 图 样 例 


符号 时 ,可 以 使 用 一 个 注解 符号 。 
(5) 控制 流 或 者 数据 流 的 流向 要 么 从 左 到 右 , 要 么 自 上 而 下 。 使 用 箭头 指示 流向 。 
(6) 尽量 避免 流 线 交 叉 。 即 使 出 现 流 线 的 交叉 ,交叉 的 流 线 之 间 也 没有 任何 逻辑 关 

系 , 不 对 流向 产生 任何 影响 。 


结构 化 查询 技术 及 其 应 用 


结构 化 查询 技术 是 实现 基于 关系 数据 库 的 审计 分 析 基 本 技术 。 审 计 师 可 以 在 客户 端 
工具 中 直接 与 数据 库 服务 器 连接 发 送 查询 语句 ,观察 查询 结果 ;也 可 以 在 AO( 审 计 师 办 
公 室 ) 软 件 系 统 中 把 查询 语句 嵌入 在 由 ALS 语言 编写 的 审计 脚本 中 ,实现 在 客户 端 工 具 
中 散人 式 数 据 查 询 。 

结构 化 查询 的 主要 操作 对 象 是 关系 数据 库 中 的 表 , 主 要 操作 是 对 表 中 的 行进 行 选择 
(SELECT)。 本 章 以 查询 “东山 县 医院 财务 库 ” 和 “东山 县 医院 业务 库 ” 两 个 数据 库 为 例 ， 
介绍 基本 的 和 常用 的 查询 技术 。 


2.1 概 述 


在 关系 数据 库 中 ,信息 被 组 织 成 若干 表 的 集合 。 表 是 行 的 集合 。 每 一 行 中 包含 了 若 
干 列 值 。 例 如 , 表 2-1 共有 10 行 ,每 行 由 “药品 编号 “名 称 ”“ 单 位 "和 “单价 ”4 个 值 。 


表 2-1 药品 
药品 编号 名 称 单 位 单价 /元 
Ao10001 青霉素 ( 甲 ) 支 0. 6300 
A010002 氨 葵 青霉素 ( 甲 ) 支 0. 8800 
A010003 青 坦 威 ( 乙 )( 凯 德 林 ) 支 38. 0000 
A010004 链 霉 素 针 ( 甲 ) 变 0. 9000 
A010005 洁 霉 素 针 ( 甲 )( 林 可 霉 素 ) 支 0. 6750 
A010006 毛 霉 素 针 ( 甲 ) 支 0. 3600 
Ao010007 红 霉 素 针 0. 25g 支 1. 2600 
A010008 红 霉 素 针 ( 甲 )30 万 支 4. 4300 
A010009 丁 胺 卡 那 针 ( 甲 )( 阿 米 卡 星 ) 支 1. 3300 
Ao10010 庆 大 霉 素 针 ( 甲 ) 村 0. 2700 


为 了 从 表 中 检索 特定 的 行 ,如 庆 大 霉 素 针 ( 甲 ) ,用 户 必 须 告 诉 数据 库 管理 系统 去 做 什 
么 。SQL 就 是 数据 库 用 户 命令 数据 库 管理 系统 实现 其 意图 的 语言 。 例 如 ,检索 庆 大 霉 素 
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针 ( 甲 ) 的 价格 及 其 他 所 有 信息 的 命令 是 


SEIECT * 

FROM 药品 

WHERE 名 称 = ' 庆 大 霉 素 针 ( 甲 )' 

SQL 是 一 个 通用 的 功能 极 强 的 关系 数据 库 标准 语言 。 使 用 SQL 不 需要 表达 如 何 访 
问 数 据 库 ,只 表达 需要 数据 库 管理 系统 做 什么 即 可 。 

在 表 2-1 所 示 的 例子 中 , 表 中 只 有 10 行 ,其 实 不 用 SQL 语句 ,通过 审计 人 员 的 眼睛 
人 工 搜索 ,也 能 很 快 找到 * 庆 大 霉 素 针 ( 甲 )”。 对 于 只 有 10 行 的 表 , 甚 至 对 于 只 有 100 行 
的 表 , 人工 搜索 确实 可 以 。 但 是 ,当面 对 一 个 10000 行 的 表 , 甚 至 一 个 1000000 行 的 表 , 采 
用 人 工 搜索 的 办 法 就 不 合适 了 ,必须 依靠 SQL 这 样 的 工具 实现 快速 检索 。 

通过 SQL 操纵 的 基本 对 象 是 表 , 表 是 数据 库 管理 系统 中 的 概念 。 从 用 户 角 度 看 , 数 
据 库 中 包含 了 若干 表 ; 从 操作 系统 角度 看 ,数据 库 是 操作 系统 中 的 一 个 或 一 组 磁盘 文件 。 
与 普通 磁盘 文件 不 同 的 是 ,这 些 文件 的 大 小 是 预先 分 配 的 , 即 用 户 创建 数据 库 时 就 把 磁盘 
空间 分 配 好 了 ,即使 还 没有 任何 数据 ;以 后 对 数据 库 中 的 所 有 访问 ,如 把 哪个 表 放 在 哪些 
磁道 和 扇 区 , 均 由 数据 库 管 理 系 统 ( 如 MS SQL Server) 负 责 。 

表 2-2 列举 了 数据 库 管理 系统 、 关 系 模型 和 操作 系统 中 关于 数据 组 织 的 一 些 术语 ,这 
些 术语 虽然 用 于 不 同 领域 ,但 经 常 互 用 。 


表 2-2 术语 的 对 应 关系 


数据 库 管理 系统 关系 模型 操作 系统 
表 关系 磁盘 文件 
行 元 组 记录 
列 属性 字段 
列 值 属性 值 数据 
列 类 型 域 数据 类 型 


数据 库 管理 系统 中 的 核心 组 成 部 分 是 数据 库 引擎 ,这 个 部 件 负责 解释 SQL 语句 ,并 
进行 优化 ,然后 执行 ,完成 对 数据 文件 的 访问 。 应 用 程序 (如 医院 的 收费 工作 站 ) 或 者 交互 
查询 工具 (如 MS SQL Server 中 的 SQL 编辑 器 ) 均 向 应 用 程序 交互 查询 工具 
数据 库 引擎 发 送 SQL 语句 。SQL 在 数据 库 管理 系统 NI 
中 的 位 置 如 图 2-1 所 示 。 和 


| SQL 


SQL 有 4 个 方面 的 功能 : 数据 定义 、 数 据 检索 、 数 数据 库 引 擎 
据 操纵 和 数据 控制 。 
数据 定义 语言 (Data Definition Language,DDL) 是 < 
用 于 创建 表 等 数据 库 对 象 的 语言 。 命 令 动词 有 
CREATE( 创 建 ) .DROP( 删 除 )、ALTER( 修 改 ) 等 。 图 2-1 SQL 在 数据 库 管理 
例如 ,创建 “医生 ” 表 的 SQL 语句 如 下 。 系统 中 的 位 置 


a 


审 册 分析 :从 类 忒 到 人 大 数 扬 


CREATE TABIE 医生 
(医生 号 CHRR(6) NOT NULL, 
姓名 CHAR(10) NOT NOLL, 
年 龄 INIEGER NOT NULL, 


部 门 camR(8) Nor NOLD) 


在 表 “ 医 生 ” 上 增加 一 列 “ 性 别 ”, 数 据 类 型 为 CHAR(4), 完 成 增加 列 的 SQL 语句 
如 下 。 


ALTER TABIE 医生 ALD 性 别 CHRR(4) 
删除 表 * 医 生 ” 的 SQL 语句 如 下 。 
DROP TABIE 医生 


数据 检索 (Data Retrieval) 指 从 数据 库 中 检索 期 望 的 数据 。 命 令 动词 是 SELECT。 
例如 ,下 面 的 语句 从 * 医 生 ” 表 中 检索 所 有 行 ,并 显示 这 些 行 在 所 有 列 (* ) 上 的 值 。 


SEIECT * 
FRCM 医 生 


数据 操纵 语言 (Data Manipulation Language,DML) 完 成 插入 、 删 除 和 修改 3 种 操作 ， 
命令 动词 分 别 是 INSERT、DELETE 和 UPDATE。 

数据 控制 语言 (Data Control Language, DCL) 的 主要 功能 是 约束 数据 库 用 户 对 数据 
的 访问 权限 ,命令 动词 有 GRANT 和 REVOKE 等 。 


2.2 基本 查询 


为 了 演示 SQL 功能 ,本 章 及 后 面 章 节 使 用 了 SQL Server 2008 中 的 两 个 数据 库 :“ 东 
山 县 医院 财务 库 ”" 和 “东山 县 医院 业务 库 ”。 东山 县 医院 财务 库 中 有 凭证 库 ,会计 科目 表 、 
科目 余额 表 、 现 金 日 记 账 101 和 银行 存款 日 记 账 102。 其 中 最 主要 的 是 凭证 库 。 和 凭证 库 
中 记载 了 会 计 记 账 凭证 。 手 工会 计 作 业 从 凭证 到 日 记 账 、 明 细 账 ,总 账 均 有 不 同人 员 登 
录 , 并 定期 核对 ,以 降低 出 错 的 可 能 性 。 而 电 算 系统 的 所 有 数据 都 来 源 于 凭证 ,只 要 一 次 
输入 原始 数据 ,系统 就 会 自动 进行 后 期 处 理 。 会 计 业 务 中 的 凭证 在 凭证 库 中 使 用 * 源 凭证 
号 ?进行 唯一 标识 。 一 个 凭证 一 般 与 凭证 库 中 的 多 行 对 应 , 即 赁 证 库 中 可 能 有 多 行 中 的 
“ 源 凭证 号 "是 相同 的 。 

东山 县 医院 业务 库 中 主要 有 “门诊 收费 "和 ”住院 收费 ”的 收费 数据 。 图 2-2 展示 了 东 
山 县 医院 业务 库 中 表 之 间 的 关系 。 从 图 2-2 中 可 以 看 到 ,“ 门 诊 收费 " 表 和 “住院 收费 ” 表 
只 是 描述 了 诊疗 机 构 一 次 向 患者 收费 的 概况 ,具体 收费 项 目 则 分 别 记录 在 “门诊 收费 明 
细 ” 和 “住院 收费 明细 ”中 。 其 他 表 . 如 部 门 、 医 生 、 药 品 、 检 查 项 目 都 是 收费 记录 引用 的 表 。 

“门诊 收费 明细 ”和 “住院 收费 明细 ”中 的 项 目 编号 既 可 以 是 “药品 ”中 的 ,也 可 以 是 “ 检 
查 项 目 ” 中 的 。 
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图 2-2 东山 县 医院 业务 库 中 表 之 间 的 关系 


2.2.1 在 Management Studio 中 设计 和 执行 查询 


Microsoft SQL Server Management Studio( 以 下 称 为 “管理 器 ”) 包 含 了 对 象 资源 管 
理 器 、SQL 编辑 器 等 客户 端 工具 。 

对 象 资源 管理 器 一 般 位 于 窗口 左 侧 ,显示 了 数据 库 、 表 和 列 等 对 象 。 该 管理 器 对 于 审 
计 人 员 观 察 数 据 库 中 有 哪些 表 、 表 中 有 哪些 列 非常 方便 。 当 对 象 资源 管理 器 被 关 掉 后 , 单 
击 “ 视 图 ”菜单 中 的 “对 象 资源 管理 器 "就 可 重新 打开 。 

可 以 在 SQL 编辑 器 中 执行 所 有 语句 或 只 执行 选 定 的 语句 。 通 过 在 编辑 器 窗 格 中 创 
建 或 打开 脚本 并 单 击 “执行 查询 ”按钮 执行 编辑 器 中 的 所 有 SQL 语句 ;通过 选择 编辑 器 窗 
格 中 的 部 分 代码 行 并 单 击 * 执 行 查询 ”按钮 只 执行 选 定 的 SQL 语句 。 

例如 ,要 从 “东山 县 医院 财务 库 ” 中 检索 源 凭证 号 是 *2003-3-31- 记 -41” 的 行 ,可 在 查询 
窗口 中 输入 如 下 语句 。 


SETEcT 凭证 号 ,摘要 

FROM 凭证 库 

WHERE 源 凭证 号 = '2003- 3- 31- 记 - 41 

输入 完毕 后 , 单 击 "执行 查询 ”按钮 (绿色 右 三 角 ) 或 单 击 "执行 "按钮 ,查询 结果 显示 在 
结果 窗 格 中 ,如 图 2-3 所 示 。 

默认 情况 下 ,在 编辑 器 窗 格 中 不 同 的 语法 成 分 使 用 不 同 的 文本 颜色 ,根据 代码 颜色 可 
以 判断 错误 。 例 如 ,如 果 输 入 一 个 关键 字 SLELCT ,而 它 不 以 蓝 色 显示 , 则 该 关键 字 可 能 
拼 错 了 。 如 果 许 多 代码 都 以 红色 显示 :那么 可 能 遗漏 了 字符 串 右边 的 引号 。 单 击 “ 分 析 ” 
按钮 只 分 析 语 法 ,而 不 执行 语句 。 在 结果 窗 格 中 双击 错误 信息 ,可 以 在 代码 中 定位 产生 该 
错误 的 行 。 

SQL 对 字母 的 大 小 写 不 敏感 。 下 面 语句 与 图 2-3 中 的 语句 等 价 。 
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二 动 分 析 : 内 天 且 可 内 娄 昌 


了 Microsoft SQL Server Nanagenent Studio 


文件 四 妨 辑 到 ) 查看 如 查询 @) 四 调 吉 0) 工具 四 窗口 四 社区 C) 帮助 0 


日 SELECT 凭证 号 ,摘要 
[om 凭证 库 
WHERE 源 凭 证 号 ='2003-3-31- 记 -41' 


收 辽 清海 洋 商贸 研究 所 资料 费 
收 辽 清海 洋 商贸 研究 所 资料 费 
收 辽 清海 洋 商 贸 研 究 所 资料 费 
收 辽 清海 洋 商贸 研究 所 资料 费 
收 辽 清海 洋 商贸 研究 所 资料 费 
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select 凭证 号 ,摘要 

from 凭证 库 

where 源 凭证 号 = '2003- 3- 31- 记 -41 

虽然 关键 字 、 表 名 、 列 名 等 大 小 写 的 效果 相同 ,但 是 通常 约定 关键 字 为 大 写 , 表 名 、 列 
名 为 小 写 。 例 如 ,一 般 写 成 : 

SEIECT ab 

FROM 七 

WHERE a= 2 


虽然 可 以 把 各 个 子 句 写 在 同一 行 上 ,但 是 通常 约定 每 行 只 写 一 个 子 句 。 例 如 ,写成 : 


SEIECT 凭证 号 ,摘要 
EFOM 凭证 库 
WHERE 源 凭证 号 = '2003-3- 31- 记 -41" 


而 不 写成 : 
SEIECT 凭证 号 ,摘要 FROM 凭证 库 WHERE 源 凭证 号 = '2003- 3- 3- 记 -41 


不 同 语法 成 分 间 要 用 空格 隔 开 ; 使 用 空格 的 个 数 不 限 。 相 同 语法 成 分 ,如 列 名 ,要 用 
西 文 逗号 隔 开 。 例 如 : 


SETIEcT 凭证 号 ,摘要 
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FROM 凭证 库 

WHERE 源 凭证 号 = '2003- 3- 3- 记 -41" 

等 同 于 逗号 后 面 增加 一 个 空格 、 等 于 号 前 后 各 一 个 空格 的 语句 。 

SEIECT 凭证 号 ， 摘要 

FROM 凭证 库 

WHERE 源 凭 证 号 =  '2003-3-3L- 记 -41" 

除非 要 录入 汉字 ,其 余 一 律 使 用 西 文 输入 状态 。 汉 字 录 入 法 不 限 。 如 果 自 己 录入 汉 
字 的 速度 较 慢 ,可 以 使 用 拖 放 的 方法 把 对 象 资源 管理 器 中 的 表 名 或 者 列 名 拖 放 到 SQL 编 
辑 器 中 。 

当 鼠 标 插入 点 在 查询 窗口 的 查询 语句 窗 格 中 时 , 单 击 工具 栏 中 的 “保存 查询 ”按钮 ,在 
弹出 的 对 话 框 中 选择 文件 位 置 并 命名 “查询 1” 可 以 把 查询 语句 保存 为 “查询 1. sqdl”。 注 
意 ,文件 的 扩展 名 为 . sql。 这 个 文件 称 为 SQL 脚本 文件 。 

单 击 工 具 栏 中 的 “打开 文件 "按钮 ,在 弹出 的 对 话 框 中 找到 需要 的 文件 ,如 “查询 1. sql”， 
将 其 选中 , 单 击 “打开 ?按钮 , 则 在 查询 窗口 中 出 现 前 面 保 存 过 的 SQL 脚本 。 

在 结果 窗 格 的 任意 处 单 击 ,然后 选择 “文件 "菜单 下 的 “将 结果 另存 为 "菜单 项 ,在 弹出 
的 对 话 框 中 选择 文件 位 置 并 命名 “查询 1”, 可 以 把 查询 结果 保存 为 查询 1. CSV”。 注 意 ， 
文件 的 扩展 名 为 . CSV。 


2.2.2 基本 的 查询 语句 
最 基本 、 最 常用 的 SELECT 语句 语法 是 : 


SEIECT < 列 名 1>，< 列 名 作 ，…，< 列 名 妆 
FROM < 表 名 > 
WHERE < 条 件 表达 式 > 


下 面 通过 几 个 例子 说 明 SELECT 语句 的 用 法 。 注 意 , 列 名 之 间 使 用 西 文 的 逗号 
隔 开 。 

例 1 写 出 从 凭证 库 表 中 查询 所 有 行 在 “凭证 号 "和 * 摘 要 ? 列 上 的 值 的 SQL 语句 。 

SEIECT 凭证 号 ,摘要 

EFCM 凭 证 库 

例 2 写 出 从 凭证 库 表 中 查询 所 有 行 在 所 有 列 上 的 值 的 SQL 语句 。 

SEIECT * 

FROM 凭证 库 

这 里 的 * 表示 所 有 列 。 当 然 , 也 可 以 在 SELECT 后 面 列 出 所 有 列 名 。 

例 3 写 出 从 凭证 库 表 中 查询 所 有 行 在 “摘要 ”和 ”凭证 号 ? 列 上 的 值 的 SQL 语句 。 


SETEcT 摘要 ,凭证 号 
EROM 凭 证 库 
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例 4 设计 SQL 语句 ,从 凭证 库 表 中 查询 所 有 行 在 “摘要 ” 列 上 的 值 。 

SETEcT 摘要 

FROM 凭 证 库 

例 5 设计 SQL 语句 ,从 凭证 库 表 中 查询 凭证 号 等 于 “1” 的 行 在 凭证 号 和 摘要 列 上 
的 值 。 

SEIECT 凭证 号 ,摘要 

FRCOM 凭 证 库 

WHERE 凭证 号 = '1' 

例 6 设计 SQL 语句 ,从 凭证 库 表 中 查询 该 表 中 涉及 哪 几 个 会 计 科 目 。 

如 果 从 * 和 凭证 库 ? 表 中 查询 所 有 行 在 “科目 编码 ”上 的 值 ; 

SETIECT 科 目 编码 

FROM 凭证 库 
会 发 现 ,上 述 查 询 结果 中 出 现 了 重复 的 行 , 即 科目 编码 重复 出 现 。 消 除 结 果 中 重复 的 数据 
行 , 才 是 需要 的 结果 。 这 种 情况 下 使 用 DISTINCT 。 


SEIECT DISTINCT 科目 编码 

FROM 凭证 库 

DISTINCT 用 于 从 SELECT 语句 的 结果 集中 除去 重复 的 行 。 如 果 没 有 指定 
DISTINCT ,查询 结果 可 能 出 现 重复 的 行 。 

注意 ,对 于 DISTINCT 关键 字 来 说 ,各 空 值 将 被 认为 是 相互 重复 的 内 容 。 当 
SELECT 语句 中 包括 DISTINCT 时 .不论 遇 到 多 少 个 空 值 ,在 结果 中 只 返回 一 个 
NULL。DISTINCT 要 写 在 SELECT 关键 字 和 第 一 个 字段 之 间 。 

如 果 在 SQL 编辑 器 中 结束 了 一 条 SELECT 语句 后 ,并 不 想 删 除 或 者 修改 该 语句 ,而 
是 保留 这 条 语句 ,继续 设计 下 一 条 语句 并 执行 ,一 般 采 取 通 过 配对 使 用 / * 和 * /把 不 想 执 
行 的 语句 括 起 来 的 办 法 实现 。 单 击 “ 执 行 查询 ”按钮 后 , SQL 编辑 器 只 会 执行 未 被 /* 和 
x / 括 起 来 的 部 分 ,而 忽略 被 /* 和 * / 括 起 来 的 部 分 。 


2.3 区 分 不 同 的 数据 类 型 


文史 类 专业 的 审计 师 通 常会 把 所 有 的 数据 都 理解 为 文本 ,但 事实 上 ,在 数据 库 中 区 分 
各 种 各 样 的 数据 : 有 的 是 整数 ,有 的 是 实数 .有 的 是 字符 ,还 有 的 是 日 期 或 者 时 间 。SQL 
Server 中 常见 的 数据 类 型 有 精确 数字 、 近 似 数字 、 字 符 串 、 日 期 和 时 间 、 货 币 等 。 表 中 的 
每 个 列 都 有 数据 类 型 。 数 据 类 型 定义 了 一 个 域 (domain), 以 及 在 这 个 域 上 允许 的 运算 。 
数据 类 型 实际 上 是 对 数据 的 一 种 约束 ,不 同 的 数据 类 型 可 以 进行 不 同 的 运算 。 

精确 数字 有 整数 .比特 .小 数 和 货币 4 种 类 型 。 

整数 有 bigint int\smallint tinyint 4 种 。bigint 类 型 是 从 一 2* (一 9 223 372 036 854 775 808) 
到 2 一 1 (9 223 372 036 854 775 807) 的 整 型 数据 (所 有 数字 ) ,使 用 8 字 节 存 储 ;int 类 型 


EP 


是 从 一 22( 一 2 147 483 648) 到 29 一 1(2 147 483 647) 的 整 型 数据 (所 有 数字 ) ,使 用 4 字 
车 存储 ,例如 “凭证 库 ” 表 中 的 “会 计 年 份 ” 列 的 类 型 为 int; smallint 类 型 是 从 一 2” 
(一 32 768) 到 2 一 1(32 767) 的 整数 数据 ,使 用 2 字 节 存储 ,例如 “会 计 科 目 ”" 表 中 的 “部 门 
核算 ” 列 的 类 型 为 smallint;tinyint 是 0 一 255 的 整数 数据 ,使 用 1 字 节 存储 ,例如 “部 门 ” 
表 的 “级 别 ? 列 为 tinyint。 

比特 (bit) 类 型 是 仅 有 1 或 0 两 个 取 值 的 精确 数字 ,如 * 部 门 ? 表 “是否 叶子 ? 列 的 类 型 
为 比特 类 型 。 

小 数 类 型 有 decimal 和 numeric 两 种 。decimal 是 从 一 10” 十 1 到 10” 一 1 的 固定 整 
数 部 分 和 小 数 部 分 的 数字 数据 。numeric 在 功能 上 等 同 于 decimal。numeric 和 decimal 
数据 类 型 的 默认 最 大 精度 值 是 38。 精 度 指 有 效 数字 的 位 数 。 例 如 ,decimal(6, 2) 表 示 小 
数 点 后 有 2 位 数字 ,小数 点 前 有 4 位 数字 。 

货币 类 型 money 固定 为 4 位 小 数 , 它 实际 上 是 带 有 4 位 小 数 的 decimal 数据 。 货 币 
数据 值 介 于 一 28 (一 9 223 372 036 854 775 808) 与 2% 一 1]( 十 9 223 372 036 854 775 807) 
之 间 。 例 如 ,“ 检 查 项 目 ” 表 的 “单价 ” 列 就 是 货币 类 型 。smallmoney 也 是 货币 类 型 ,其 数 
据 值 介 于 一 214 748. 3648 与 十 214 748. 3647 之 间 。 如 果 数 值 超过 了 上 述 范 围 , 则 可 使 用 
decimal 数据 类 型 代替 。money 和 smallmoney 被 限制 到 小 数 点 后 4 位。 如果 要 求 小 数 点 
后 有 更 多 位 , 则 使 用 decimal 数据 类 型 。 

近似 数字 有 float 和 real 两 种 类 型 。 

float 类 型 表示 从 一 1. 79E 十 308 到 1. 79E 十 308 的 浮 点 数字 ,使 用 8 字 节 存储 。 例 
如 光 和 凭证 库 ? 表 中 的 “借方 金额 ? 列 的 类 型 为 float。 虽 然 “ 借 方 金额 ”类 型 可 以 为 float, 但 
一 般 使 用 money。 因 为 在 计算 机 内 部 使 用 二 进 制 表示 , 当 表 示 一 个 浮 点 数 和 进行 浮 点 计 
算 时 ,存在 舍 入 误差 。 壁 如 ,0. 1 就 不 能 被 精确 地 表示 。26 个 0. 1 相 加 得 到 的 是 
2. 600000000000001 ,而 不 是 2.6。 两 个 浮 点 数字 的 差 小 于 一 个 很 小 的 数 ,如 相差 10“ 就 
可 以 认为 两 个 浮 点 数 相 等 。 

real 是 从 一 3. 40E 十 38 到 3. 40E 十 38 的 浮 点 精度 数字 ,使 用 4 字 节 存储 。 

由 于 float 和 real 数据 类 型 的 这 种 近似 性 , 当 要 求 精确 的 数字 状态 时 ,如 在 财务 应 用 
程序 中 ,在 那些 需要 舍 入 的 操作 中 .或 在 等 值 核对 的 操作 中 ,就 不 使 用 这 些 数据 类 型 。 这 
时 就 要 用 integer、decimal、money 或 smallmoney 数据 类 型 。 

非 Unicode 编码 字符 (char、varchar、text) ,如 果 是 英文 , 则 使 用 1 字 节 存储 ;如 果 是 
汉字 , 则 使 用 2 字 节 存储 。char(n) 是 固定 长 度 的 非 Unicode 字符 数据 ,最 大 长 度 为 8000 
个 字符 ;varchar(n) 是 可 变 长 度 的 非 Unicode 数据 ,最 长 为 8000 个 字符 ;text 是 可 变 长 度 
的 非 Unicode 数据 ,最 大 长 度 为 2? 一 1(2 147 483 647) 个 字符 。 

对 于 Unicode 编码 字符 串 (nchar、nvarchar、ntext) ,字符 (如 中 日 、. 韩 等 ) 均 使 用 2 字 
节 编 码 。nchar(n) 表 示 固 定 长 度 的 Unicode 数据 ,最 大 长 度 为 4000 个 字符 ;nvarchar(n) 
表示 可 变 长 度 Unicode 数据 ,其 最 大 长 度 为 4000 个 字符 ;ntext 表示 可 变 长 度 Unicode 数 
据 ,其 最 大 长 度 为 2” 一 1(1 073 741 823) 个 字符 。Unicode 为 每 一 个 字符 提供 一 个 唯一 的 
编码 ( 即 一 组 数字 )。Unicode 编码 系统 可 分 为 编码 方式 和 实现 方式 两 种 。 一 个 字符 的 
Unicode 编码 是 确定 的 ,但 对 Unicode 编码 的 实现 方式 有 所 不 同 。Unicode 的 实现 方式 称 
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为 Unicode 转换 格式 (Unicode Translation Format,UTF) 。 

如 果 需 要 跨 平 台 传输 字符 ,建议 使 用 Unicode 编码 字符 串 。 使 用 Unicode 编码 的 目 
的 是 解决 不 同 计算 机 系统 .不 同 应 用 系统 中 处 理 各 国文 字 的 问题 。 使 用 nchar 或 者 
nvarchar 可 以 减少 字符 转换 问题 ,防止 在 某 些 情况 下 出 现 乱 码 。 

如 果 所 存 数 据 长 度 基本 一 致 ,建议 使 用 char 型 或 者 nchar 型 ,这 样 查询 速度 快 , 但 是 
使 用 时 注意 剔除 数据 两 边 的 空格 ;如 果 所 存 数 据 长 度 差 异 较 大 ,可 以 使 用 varchar 型 或 者 
nvarchar 型 。 

常用 的 日 期 和 时 间 数 据 类 型 有 datatime 和 smalldatetime 两 种 。datetime 数据 类 型 
表示 从 1753 年 1 月 1 日 到 9999 年 12 月 31 日 的 日 期 和 时 间 数 据 , 精 确 到 百 分 之 三 秒 
(或 3.33ms) ,使 用 8 字 节 存储 ,如 “门诊 收费 明细 ” 表 中 的 “住院 日 期 * 列 ;smalldatetime 
数据 类 型 表示 从 1900 年 1 月 1 日 到 2079 年 6 月 6 日 的 日 其 和 时 间 数 据 ,精确 到 分 钟 ,使 
用 4 字 节 存储 ,如 “凭证 库 ” 表 中 的 “凭证 日 期 * 列 。 单 独 的 日 期 类 型 和 时 间 类 型 分 别 是 


data 和 time。 


2.4 字面 量 的 格式 要 求 


字面 量 也 称 为 字面 值 或 常量 ,是 在 SQL 脚本 中 表示 特定 数据 值 的 符号 。 例 如 ,查询 
凭证 日 期 为 2013 年 3 月 11 日 的 所 有 凭证 的 SQL 语句 中 就 使 用 了 字面 量 2013-03-11 : 

SEIECT #% 

ERCOM 凭 证 库 

WHERE 凭证 日 期 = '2013- 03- 11' 

在 SQL 语句 中 ,不 同类 型 的 字面 量 有 不 同 的 格式 要 求 。 例 如 ,2013-03-11 就 是 日 期 
型 字面 量 ,要 求 使 用 单 引号 ,并 使 用 ”-” 分 隔年 月 日 。 

字面 量 的 格式 取决 于 它 所 表示 的 值 的 数据 类 型 。 根 据 数据 类 型 的 不 同 , 有 字符 串 字 
面 量 .比特 字面 量 .日 期 和 时 间 字 面 量 ,整数 字面 量 . 小 数字 面 量 , 浮 点 数 和 实数 字面 量 、 货 
币 字 面 量 等 。 

字符 串 字 面 量 使 用 单 引 号 引起 来 ,字符 串 中 可 以 包含 字母 .数字 字符 (a 一 z、A 一 Z 和 
0 一 9) 以 及 特殊 字符 ,如 感叹 号 (1) .at 符 (@) 和 数字 号 (#) 等 。 例 如 ,河北 省 审计 厅 ', 
文件 复制 完成 了 50% .' 等 。 

中 间 没 有 任何 字符 的 两 个 单 引号 ' 表示 "* 空 字符 串 。 

比特 (bitb) 字 面 量 使 用 数字 0 或 1 表示 ,并且 不 使 用 引号 。 

日 期 和 时 间 (datetime) 字 面 量 使 用 特定 格式 的 字符 日 期 值 表示 ,并 被 单 引号 括 起 来 。 
例如 : 2017-12-01 14:05:00 表示 “2017 年 12 月 1 日 下 午 2 点 5 分 0 秒 ”。 

以 下 格式 的 日 期 字面 量 也 是 合法 的 : 'April 15, 1998','15 April, 1998', '980415', 
20080101','04/15/1998','2006-10-15',2006/10/15'; 时 间 字 面 量 14:30:24' 表示 24 小 时 格 
式 的 下 午 2 点 30 分 24 秒 .04:24 PM 表示 12 小 时 格式 的 下 午 4 点 24 分 .04:24 AM 表示 
12 小 时 格式 的 凌晨 4 点 24 分 。 
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整数 (integer) 字 面 量 由 没有 用 引号 括 起 来 且 不 含 小 数 点 的 一 串 数字 表示 。 例 如 12。 

小 数 (decimal) 字 面 量 由 没有 用 引号 括 起 来 且 包含 小 数 点 的 一 串 数 字 表 示 。 例 如 12. 3。 

浮 点 数 (float) 和 实数 (real) 字 面 量 使 用 科学 计数 法 表示 ,如 101. 5E5、0. 5E 一 2。 

货币 (money) 字 面 量 表示 以 可 选 小 数 点 和 可 选 货币 符号 作为 前 级 的 一 串 数字 。 这 些 
字面 量 不 使 用 引号 ,如 $542023. 14。 

车 要 指明 一 个 数 是 正 数 还 是 负数 , 则 对 数字 字面 量 应 用 十 或 一 的 一 元 运算 符 。 使 用 
NULL 或 者 null 表示 “ 空 值 ”字面 量 。 


2.5 使 用 表达 式 


表达 式 是 标识 符 、 字 面 量 和 运算 符 的 组 合 ,并 能 通过 计算 得 到 一 个 值 。SQL 语句 中 
可 在 多 个 不 同 的 位 置 出 现 表达 式 。 下 面 通过 几 个 例子 演示 如 何在 SQL 语句 中 使 用 表 

例 7 设计 SQL 语句 ,从 药品 表 中 查询 所 有 药品 ,显示 其 编号 和 加 价 10% 后 的 单价 。 

SEIECT 药品 编号 , 单价 * 1.1 

FROM 药品 

在 这 个 例子 中 ,“ 药 品 编号 ”本 身 是 表达 式 , 它 返回 “药品 编号 ” 列 中 的 值 ;单价 * 1.1 
是 算术 表达 式 , 这 个 表达 式 用 作 查 询 结 果 中 的 列 。 

例 8 设计 SQL 语句 ,从 凭证 库 表 中 查询 “102” 科 目的 摘要 。 

SEIECT 摘要 

FROM 凭证 库 

WHERE 科目 编码 = '102' 

在 这 个 例子 中 ,科目 编码 二 '102' 也 是 表达 式 , 它 返回 逻辑 值 * 真 ”或 者 “ 假 ”, 称 为 布 
尔 表达 式 。 将 表达 式 用 作 查 询 条 件 . 可 以 利用 该 表达 式 检索 期 望 的 行 。 

例 9 如 果 查 询 结 果 中 不 涉及 表 中 的 列 , 则 可 以 没有 FROM 子 句 ,例如 : 


SEIECT “河北 省 审计 厅 '，" 培 训 … 2007 
查询 结果 如 下 (结果 仍 为 一 个 表 ) 。 


(无 列 名 ) (无 列 名 ) (无 列 名 ) 
河北 省 审计 厅 培训 2007 


运算 符 用 来 执行 算术 、 比 较 .连接 或 赋值 操作 。SQL Server 有 7 类 运算 符 , 见 表 2-3。 


表 2-3 运算 符 汇总 
运 算 符 执行 运算 
算术 加 法 \ 减 法 、 乘 法、 除法, 求 模 
赋值 将 值 赋 给 变量 ,或 将 结果 集 列 与 别名 相关 联 


审 动 分 析 : 从 基 系 到 类 数 揭 


续 表 
运 算 符 执行 运算 
比较 将 数值 与 另 一 个 数值 或 表达 式 进行 比较 
逻辑 真 假 , 如 AND、OR、NOT 
谓词 返回 布尔 值 , 常 见 的 有 LIKE、ANY、ALL IN 等 
字符 串 串联 将 两 个 字符 串 ( 字 符 或 二 进 制 数 ) 合 并 为 一 个 字符 串 
元 执行 有 一 个 操作 数 的 运算 ,如 正 、 负 


算术 运算 符 包括 加 \ 减 乘除 、 取 模 等 。 这 些 运 算 的 符号 及 含义 见 表 2-4。 


表 2-4 算术 运算 符 
运算 符 名 称 且  : 诺 
学 加 加 法 
和 减 减法 
* 乘 乘法 
除 除法 
% 模 返回 一 个 除法 的 整数 余数 。 例 如 ,12%5 二 2, 这 是 因为 12 除 以 5 的 余数 为 2 


加 (十 ) 和 减 (一 ) 运 算 符 也 可 用 于 对 datetime 及 smalldatetime 值 执行 算术 运算 。 使 
用 () 可 以 改变 运算 符 优先 级 : 2 * (6 十 9)/3。 


例 10 


单价 。 


设计 SQL 语句 ,从 药品 表 中 查询 所 有 药品 的 名 称 以 及 增加 一 元 后 的 药品 的 


SEIECT 名 称 , 单价 +1 

FROM 药品 

此 例 中 使 用 加 法 运算 符 计算 “单价 ”, 在 查询 结果 中 形成 一 个 新 的 列 。 注 意 , 表 中 的 
“单价 ” 列 并 未 发 生变 化 , 仅 在 查询 结果 中 单价 增加 了 1。 但 是 ,由 表达 式 “ 单 价 十 1” 形 成 
的 查询 结果 的 新 列 并 没有 列 名 。 在 SELECT 语句 中 ,如 果 某 列 是 一 个 表达 式 , 则 该 列 默 
认 没 有 列 名 。 以 下 语句 为 表达 式 “ 单 价 十 1” 指 定 了 名 字 “ 新 单价 ”。 

sEIECT 名 称 , 单价 +1 as 新 单价 


FECM 药品 
当然 , 列 名 可 以 直接 是 表达 式 ,也 可 以 为 表达 式 指 定 一 个 列 名 ,如 : 
SEIECT 名 称 AS 药品 名 称 , 单价 +1 PS 新 单价 

FROM 药品 


这 个 SELECT 语句 中 为 “名 称 ” 列 指定 了 另外 一 个 列 名 “药品 名 称 ”。 通 过 保留 字 AS 
指定 的 列 名 称 为 列 的 “别名 (alias)”。 
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元 执行 有 一 个 操作 数 的 运算 ,如 正 、 负 


算术 运算 符 包括 加 \ 减 乘除 、 取 模 等 。 这 些 运 算 的 符号 及 含义 见 表 2-4。 
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除 除法 
% 模 返回 一 个 除法 的 整数 余数 。 例 如 ,12%5 二 2, 这 是 因为 12 除 以 5 的 余数 为 2 


加 (十 ) 和 减 (一 ) 运 算 符 也 可 用 于 对 datetime 及 smalldatetime 值 执行 算术 运算 。 使 
用 () 可 以 改变 运算 符 优先 级 : 2 * (6 十 9)/3。 
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单价 。 


设计 SQL 语句 ,从 药品 表 中 查询 所 有 药品 的 名 称 以 及 增加 一 元 后 的 药品 的 


SEIECT 名 称 , 单价 +1 

FROM 药品 

此 例 中 使 用 加 法 运算 符 计算 “单价 ”, 在 查询 结果 中 形成 一 个 新 的 列 。 注 意 , 表 中 的 
“单价 ” 列 并 未 发 生变 化 , 仅 在 查询 结果 中 单价 增加 了 1。 但 是 ,由 表达 式 “ 单 价 十 1” 形 成 
的 查询 结果 的 新 列 并 没有 列 名 。 在 SELECT 语句 中 ,如 果 某 列 是 一 个 表达 式 , 则 该 列 默 
认 没 有 列 名 。 以 下 语句 为 表达 式 “ 单 价 十 1” 指 定 了 名 字 “ 新 单价 ”。 

sEIECT 名 称 , 单价 +1 as 新 单价 


FECM 药品 
当然 , 列 名 可 以 直接 是 表达 式 ,也 可 以 为 表达 式 指 定 一 个 列 名 ,如 : 
SEIECT 名 称 AS 药品 名 称 , 单价 +1 PS 新 单价 

FROM 药品 


这 个 SELECT 语句 中 为 “名 称 ” 列 指定 了 另外 一 个 列 名 “药品 名 称 ”。 通 过 保留 字 AS 
指定 的 列 名 称 为 列 的 “别名 (alias)”。 
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加 法 算术 运算 符 也 可 以 将 一 个 以 天 为 单位 的 数字 加 到 日 期 中 。 例 如 ,从 凭证 库 表 中 
查询 所 有 的 凭证 日 期 和 该 凭证 日 期 的 次 日 。 

SETECT 凭证 日 期 , 凭证 日 期 +125 次 日 

FROM 凭证 库 

“次 日 ?就 是 通过 把 datetime 类 型 的 凭证 日 期 加 1 实现 的 。 

例 11 设计 SQL 语句 ,从 药品 表 中 汇总 查询 所 有 药品 的 名 称 .单价 与 进 价 之 差 。 


SETIECT 名 称 , 单价 - 进 价 as 差价 

EPROM 药品 

这 个 例子 使 用 减法 运算 符 计算 所 有 药品 零售 价 与 进 价 之 差 。 减 法 算术 运算 符 也 可 以 
从 日 期 中 减 去 一 个 以 天 数 为 单位 的 数值 。 例 如 ,从 凭证 库 表 中 查询 所 有 的 凭证 日 期 和 该 
凭证 日 期 的 前 一 日 。 

SETIEcT 凭证 日 期 , 凭证 日 期 -1 

FROM 凭证 库 

这 个 例子 从 datetime 日 期 类 型 的 凭证 日 期 减 去 1 天 得 到 该 日 期 的 前 一 天 。 

例 12 设计 SQL 语句 ,从 药品 表 中 查询 所 有 药品 的 名 称 以 及 加 价 50% 后 的 单价 。 


SEIECT 名 称 , 单价 * 1.5 BS 新 单价 
FROM 药品 


这 个 例子 通过 使 用 算术 乘法 运算 符 的 表达 式 得 到 加 价 50% 后 的 结果 。 

例 13 设计 SQL 语句 ,从 药品 表 中 查询 所 有 药品 名 称 及 其 单价 的 半价 。 

SEIEcT 名 称 , 单价 /2 Ps 半价 

FRCM 药品 

这 个 例子 使 用 算术 除法 运算 符 用 “单价 ” 除 以 2 得 到 “半价 ”。 

如 果 算 术 表 达 式 中 出 现 NULL 值 , 则 结果 仍 为 NULL。 例 如 ,SELECT5 十 NULL 的 
结果 为 NULL。 

如 果 两 个 操作 数 之 一 是 字符 串 ,那么 加 号 就 成 为 字符 串 串联 运算 符 。 

例 14 设计 SQL 语句 ,从 医生 表 中 查询 所 有 医生 的 姓名 和 医生 号 ,并 以 “姓名 (医生 
号 )” 格 式 显 示 查 询 结果 。 

SELECT 姓名 +'(' + 医生 号 + 9 

FROM 医生 

表达 式 “ 姓 名 十 (' 十 医生 号 十 )” 把 4 个 字符 串 连 接 在 一 起 : 姓名 、(、 医 生 号 、) 。 
假如 姓名 是 “ 陶 继 民 ”, 医 生 号 是 “20101”, 那 么 查询 结果 为 “ 陶 继 民 (20101)”。 

比较 运算 符 的 结果 是 布尔 数据 类 型 , 它 有 3 种 值 : TRUE、FALSE 及 UNKNOWN。 
比较 运算 符 见 表 2-5。 


审 动 分 机: 从 关系 到 大 数据 


表 2-5 比较 运算 符 
运算 符 会 时 运算 符 会 时 
= 等 于 < 不 等 于 
> 天 手 != 不 等 于 ( 非 SQL-92 标准 ) 
六 小 于 !< 不 小 于 ( 非 SQL-92 标准 ) 
ey 大 于 或 等 于 !> 不 大 于 ( 非 SQL-92 标准 ) 
<= 小 于 或 等 于 


下 面 通过 几 个 例子 演示 比较 运算 符 的 使 用 。 

例 15 设计 SQL 语句 ,从 凭证 库 表 中 查询 科目 编码 为 102 的 行 。 

SEIECT * 

FROM 凭证 库 

WHERE 科目 编码 = '102" 

这 个 例子 使 用 比较 运算 符 “ 王 ”, 比 较 和 凭证 库 表 中 每 一 行 的 科目 编码 是 否 与 “102” 相 
等 。 由 于 科目 编码 是 char 类 型 ,所 以 字面 量 *102” 要 用 单 引 号 引起 来 。 

例 16 设计 SQL 语句 ,从 凭证 库 表 中 查询 借方 金额 大 于 10000 元 的 行 。 

SEIECT 关 

FEOM 凭 证 库 

WHERE 借方 金额 >10000 

这 个 例子 使 用 比较 运算 符 “ 二 ”判断 凭证 库 表 中 每 一 行 的 借方 金额 是 否 大 
10000 元 。 

例 17 设计 SQL 语句 ,从 凭证 库 表 中 查询 借方 金额 大 于 或 等 于 10000 元 的 行 。 


SELECT * 
FRCM 凭证 库 
WHERE 借方 金额 >= 10000 
这 个 例子 使 用 比较 运算 符 “ 之 = "判断 凭证 库 表 中 每 一 行 的 借方 金额 是 否 大 于 或 等 
10000 元。 
例 18 设计 SQL 语句 ,从 凭证 库 表 中 查询 借方 金额 小 于 10000 元 的 行 。 


ni 


SETECT * 
FROM 凭证 库 

WHERE 借方 金额 <10000 

这 个 例子 使 用 比较 运算 符 “<=” 判 断 凭证 库 表 中 每 一 行 的 借方 金额 是 否 小 于 10000 元 。 
例 19 设计 SQL 语句 ,从 凭证 库 表 中 查询 借方 金额 小 于 或 等 于 10000 元 的 行 。 
SEIECT * 

FROM 凭证 库 

WEHEFE 借方 金额 <=10000 
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这 个 例子 使 用 比较 运算 符 “ 一 = ”判断 凭证 库 表 中 每 一 行 的 借方 金额 是 否 小 于 或 等 于 
10000 元 。 

例 20 设计 SQL 语句 ,从 凭证 库 表 中 查询 科目 名 称 不 是 “银行 存款 ”的 行 。 

SETRCT * 

FROM 凭证 库 

WHERE 科目 名 称 <> "银行 存款 ' 

这 个 例子 使 用 比较 运算 符 “ 二 二 ”判断 凭证 库 表 的 每 一 行 的 科目 名 称 是 否 为 “ 银 
行 存款 ”。 

例 21 设计 SQL 语句 ,从 会 计 科目 表 中 查询 顶级 科目 。 

SETRCT * 

FFCM 会 计 科目 表 

WHERE 上 级 科目 编码 IS NULL 

“顶级 科目 ” 即 没 有 上 级 科目 的 科目 ,也 就 是 该 科目 的 “上 级 科目 编码 ”为 空 。 这 个 例 
子 使 用 保留 字 is 判断 会 计 科目 表 的 每 一 行 ,也 就 是 每 个 科目 的 * 上 级 科目 编码 ”是 否 为 
空 ,保留 字 NULL 表示 “ 空 值 "。 注 意 ,NULL 的 含义 是 没有 值 ,而 不 是 值 为 0 或 空格 。 不 
要 使 用 比较 运算 符 “ 王 "与 NULL 进行 比较 ,如 : 

SEIECT 关 

EFCM 会 计 科目 表 

WHERE 上 级 科目 编码 =NULL 

这 是 因为 “上 级 科目 编码 = NULL” 的 结果 是 UNKNOWN (不 知道 ),NULL 一 
NULL 的 比较 结果 默认 也 是 UNKNOWN。 

例 22 设计 SQL 语句 ,从 会 计 科 目 表 中 查询 非 顶 级 科目 。 

SEIECT * 

FRCM 会 计 科目 表 

WHERE 上 级 科目 编码 IS NOT NULL 

“ 非 项 级 科目 ” 即 上 级 科目 编码 不 为 空 的 科目 。 这 个 例子 中 ,IS NOT NULL 表示 “不 
逻辑 运算 符 对 某 个 条 件 进行 测试 ,以 获得 其 真实 情况 。 人 逻辑 运 算 符 和 比较 运算 符 一 
样 ,都 返回 带 有 TRUE 或 FALSE 值 的 布尔 数据 类 型 。T-SQL 中 的 逻辑 运算 符 见 
表 2-6。 

表 2-6 TSQL 中 的 逻辑 运算 符 


运算 符 名 称 含义 
AND 而 且 如 果 其 两 侧 的 条 件 同时 成 立 , 则 运算 结果 成 立 (TRUE) 
NOT 否 对 任何 其 他 布尔 运算 符 的 值 取 反 
OR 或 如 果 其 两 侧 的 条 件 有 一 个 成 立 , 则 运算 结果 就 为 TRUE 


二 动 分 和 醒 : 内 的 国 到 大 上 购 旺 
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这 3 个 逻辑 运算 符 中 ,NOT 优先 级 最 高 ,OR 优先 级 最 低 。 比 较 运算 符 优 先 级 高 
逻辑 运算 符 。 下 面 通过 几 个 例子 演示 逻辑 运算 符 的 使 用 。 

例 23 设计 SQL 语句 ,从 凭证 库 表 中 查找 满足 两 个 条 件 的 行 ; 一 是 科目 名 称 为 “ 现 
金 ”; 二 是 贷方 金额 为 10000 元 以 上 ( 含 10000 元 )。 


SETECT * 

FROM 凭证 库 

WHERE 科目 名 称 = ' 现 金 ' AND 贷方 金额 >=10000 

在 这 个 例子 中 ,关系 表达 式 “ 科 目 名 称 二 现金 "表达 了 第 1 个 条 件 , 关 系 表 达 式 “ 贷 
方 金额 二 二 10000” 表 达 了 第 二 个 条 件 , 由 于 要 求 这 两 个 条 件 都 满足 ,所 以 使 用 逻辑 运算 
符 AND 进行 连接 。AND 运算 符 要 求 AND 前 后 的 表达 式 都 为 真 时 ,AND 运算 的 结果 才 
为 真 。 数 据 库 引擎 根据 逻辑 表达 式 “ 科 目 名 称 二 现金 ' AND 贷方 金额 之 一 10000” 逐 行 
扫描 凭证 库 , 如 果 第 某 行 的 科目 名 称 等 于 “现金 "而且 第 i 行 的 贷方 金额 大 于 或 等 于 
10000 元 , 则 将 该 行 作为 结果 集中 的 一 行 。 

例 24 设计 SQL 语句 ,从 凭证 库 表 中 查询 满足 两 个 条 件 之 一 的 行 : 贷方 金额 10000 
元 以 上 ( 含 10000 元 ) ,或 借方 金额 10000 元 以 上 ( 含 10000 元 ) 。 

SEIECT * 

FRCM 凭证 库 

WHERE 贷方 金额 >= 10000 oR 借方 金额 >=10000 

在 这 个 例子 中 ,使 用 关系 表达 式 * 贷 方 金 额 过 =10000" 表 达 前 一 个 条 件 ; 使 用 关系 表 
达 式 “借方 金额 二 二 10000” 表 达 后 一 个 条 件 , 由 于 要 求 这 两 个 条 件 之 一 满足 即 可 ,所 以 使 
用 逻辑 运算 符 OR 进行 连接 。OR 运算 符 连接 的 两 个 条 件 只 要 其 中 一 个 条 件 为 真 ,OR 运 
算 的 结果 就 为 真 。 数 据 库 引擎 根据 逻辑 表达 式 “ 贷 方 金额 之 一 10000 OR 借方 金额 之 一 
10000” 逐 行 扫描 凭证 库 , 如 果 某 行 的 贷方 金额 大 于 或 等 于 10000 元 ,或 者 借方 金额 大 于 或 
等 于 10000 元 , 则 将 该 行 作 为 结果 集中 的 一 行 。 

例 25 设计 SQL 语句 ,从 凭证 库 表 中 查询 满足 以 下 两 个 条 件 的 行 : 科目 名 称 为 “ 现 
金 ”, 而 且 贷 方 金额 或 借方 金额 为 10000 元 以 上 ( 含 10000 元 ) 。 

SEIECT 关 

FROM 凭证 库 

WHERE 科目 名 称 = ' 现 金 ' AND (贷方 金额 >=10000 CR 借方 金额 >= 10000) 

这 个 例子 使 用 关系 表达 式 “ 科 目 名 称 二 现金 "表达 第 一 个 条 件 ; 使 用 逻辑 表达 式 “ 贷 
方 金额 二 二 10000 OR 借方 金额 之 = 10000” 表 达 第 二 个 条 件 , 使 用 逻辑 运算 符 AND 表 
示 “ 而 且 ”。 如 果 把 WHERE 后 面 的 条 件 写 成 “科目 名 称 二 ' 现 金 ' AND 贷方 金额 二 = 
10000 OR 借方 金额 二 二 10000”, 那 么 其 含义 就 变 成 : 科目 名 称 是 “现金 ”而 且 贷 方 金额 
为 10000 元 以 上 ,或 者 借方 金额 为 10000 元 以 上 (无 论 科 目 名 称 是 否 是 “现金 ”)。 这 是 因 
为 逻辑 运算 符 OR 的 优先 级 低 于 人 逻辑 运算 符 AND, 数 据 库 引 擎 就 会 先 计 算 “ 科 目 名 称 一 
现金 ' AND 贷方 金额 之 = 10000”, 然 后 再 与 关系 表达 式 “ 借 方 金额 二 二 10000” 进 行 OR 
运算 。 
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例 26 设计 SQL 语句 ,从 凭证 库 表 中 查询 科目 名 称 不 是 “现金 ”的 行 。 

SEIECT 关 

FROM 凭证 库 

WHERE NOT 科目 名 称 = ' 现 金 ' 

在 这 个 例子 中 ,数据 库 引 擎 会 先 计 算 关 系 表达 式 “ 科 目 名 称 二 现金 ", 得 到 一 个 逻辑 
值 ,然后 再 使 用 逻辑 运算 符 NOT 改变 这 个 逻辑 值 。 

例 27 设计 SQL 语句 ,从 凭证 库 中 查找 满足 这 两 个 条 件 的 行 : 科目 名 称 不 是 “ 现 
金 ”, 而 且 贷 方 金额 或 借方 金额 为 10000 元 以 上 。 

SEIECT * 

FROM 凭证 库 

WHERE NOT 科目 名 称 = ' 现 金 ' RND (贷方 金额 >=10000 CR 借方 金额 >= 10000) 

在 这 个 例子 中 ,使 用 逻辑 表达 式 “NOT 科目 名 称 = 现金 "表达 了 第 一 个 条 件 ; 使 用 
逻辑 表达 式 “ 贷 方 金额 二 = 10000 OR 借方 金额 之 = 10000” 表 达 了 第 二 个 条 件 。 这 两 
个 条 件 使 用 人 逻辑 运算 符 AND 连接 。 

例 28 设计 SQL 语句 ,从 凭证 库 表 中 查询 科目 名 称 为 “银行 存款 ?或 者 “现金 ”的 行 。 

SEIECT 关 

FROM 凭证 库 

WHERE 科目 名 称 = ' 现 金 ' cR 科目 名 称 = "银行 存款 ' 

这 个 例子 使 用 关系 表达 式 “ 科 目 名 称 = 现金 "表达 了 科目 名 称 为 “现金 ", 使 用 关系 
表达 式 “ 科 目 名 称 = 银行 存款 ”表达 了 科目 名 称 为 “银行 存款 ”。 由 于 要 求 这 两 个 条 件 二 
者 之 一 满足 即 可 ,所 以 使 用 逻辑 运算 符 OR 连接 。 注 意 , 不 要 写成 : 

SEIECT * 

FROM 凭证 库 

WHERE 科目 名 称 = ' 现 金 ' oR "银行 存款 ' 

这 是 因为 表达 式 “ 银 行 存款 "不 是 一 个 逻辑 表达 式 。 

除了 以 上 介绍 的 算术 运算 符 、 关 系 运 算 符 、 逻 辑 运 算 符 外 ,还 有 一 类 运算 符 称 为 “ 谓 
词 " 运 算 符 。 这 些 运 算 符 使 用 保留 字 标识 。 谓 词 运算 的 结果 为 一 个 逻辑 值 。 常 见 的 谓词 
运算 符 及 其 含义 见 表 2-7。 谓 词 运算 符 的 优先 级 高 于 逻辑 运算 符 。 

表 2-7 常见 的 谓词 运算 符 及 其 含义 


运算 符 含义 
IN 如 果 操 作 数 等 于 表达 式 列表 中 的 一 个 ,那么 就 为 TRUE 
BETWEEN…AND 如 果 操 作 数 在 某 个 范围 之 内 ,那么 就 为 TRUE 
LIKE 如 果 操 作 数 与 一 种 模式 相 匹 配 , 那 么 就 为 TRUE 
EXISTS 如 果子 查询 不 为 空 , 那 么 就 为 TRUE 
ALL 如 果 一 系列 的 比较 都 为 TRUE, 那 么 就 为 TRUE 
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续 表 
运算 符 含 复 
ANY 如 果 一 系列 的 比较 中 任何 一 个 为 TRUE, 那 么 就 为 TRUE 
SOME 如 果 在 一 系列 比较 中 有 些 为 TRUE, 那 么 就 为 TRUE。 与 ANY 等 价 


下 面 通 过 几 个 例子 说 明 谓词 运算 符 的 应 用 。 

例 29 从 凭证 库 表 中 查询 科目 名 称 为 “银行 存款 ”, 或 者 现金", 或 者 “应 交 营 业 税 ” 
的 行 。 

SEIECT * 

FRCM 凭证 库 

WHEFE 科目 名 称 = ' 银 行 存款 ' oR 科目 名 称 = ' 现 金 ' CR 科目 名 称 = ' 应 交 营 业 税 ' 

这 个 例子 要 求 科目 名 称 满足 3 个 取 值 之 一 即 可 ,使 用 逻辑 运算 符 OR 连接 3 个 关系 
表达 式 能 够 表达 科目 名 称 为 “银行 存款 ”, 或 者 现金”, 或 者 “应 交 营 业 税 ”, 但 是 不 够 简洁 。 
这 种 情况 下 可 以 使 用 谓词 IN。 

SEIECT * 

FRCM 凭证 库 

whEFRE 科目 名 称 IN (银行 存款 '，' 现 金 '， "应 交 营 业 税 ) 

表达 式 “ 科 目 名 称 IN (银行 存款 '， 现 金 ， 应 交 营 业 税 ) "与 表达 式 “ 科 目 名 称 = 银 
行 存款 'OR 科目 名 称 二 现金 'OR 科目 名 称 = 应 交 营业 税 " 具 有 相同 的 含义 。 

例 30 ”从 凭证 库 表 中 查询 借方 金额 大 于 或 等 于 10000 元 同时 小 于 或 等 于 20000 元 的 行 。 

SEIECT 关 

FRCM 凭证 库 

WHERE 借方 金额 >= 10000 aND 借方 金额 <= 20000 

这 个 例子 使 用 关系 表达 式 “ 借 方 金额 之 = 10000” 表 达 “ 借 方 金额 大 于 或 等 于 10000 
元 ”; 使 用 关系 表达 式 “ 借 方 金额 二 二 20000” 表 达 “ 借 方 金额 小 于 或 等 于 20000 元 ”, 然 后 
使 用 逻辑 运算 符 AND 连接 这 两 个 条 件 , 表 示 需 要 “同时 ”满足 。 由 于 这 两 个 条 件 都 是 对 
“借方 金额 ”的 限制 ,而 且 限制 在 一 个 闭 区 间 内 ,所 以 这 种 情况 下 可 使 用 "BETWEEN 
AND”。 

SEIECT 关 

FROM 凭证 库 

WHERE 借方 金额 BETWEEN 10000 AND 20000 

表达 式 “ 借 方 金额 BETWEEN 10000 AND 20000” 的 含义 与 表达 式 “ 借 方 金额 > 一 
10000 AND 借方 金额 二 二 20000” 的 含义 相同 。 

例 31 设计 SQL 语句 ,从 凭证 库 表 中 查询 借方 金额 为 10000 一 20000 元 ,而 且 科 目 
名 称 为 “现金 ”的 行 。 


SETECT 关 
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FEOM 和 凭证 库 

WHERE 借方 金额 BETWEEN 10000 AND 20000 AND 科目 名 称 = ' 现 金 ' 

从 这 个 例子 中 可 以 看 到 ,使 用 BETWEEN AND 谓词 使 得 表达 式 更 加 简洁 、 易 懂 。 

谓词 LIKE 与 通配符 配合 ,用 于 模糊 查询 。 通 配 符 有 两 个 , 即 % 和 _。 其 中 ,% 通 配 任 
意 字 符 串 ,包括 空 串 ; 而 _ 仅 通 配 单个 字符 ,不 包括 空 串 。 每 个 汉字 或 每 个 英文 字母 都 是 一 
个 字符 。 下 面 通过 几 个 例子 说 明 如 何 应 用 谓词 LIKE。 

例 32 设计 SQL 语句 ,从 凭证 库 表 中 查询 摘要 包含 “ 费 ” 的 行 。 

SEIEcT * FROM 凭证 库 WHERE 摘要 LIKE ' 必 费 s， 

表达 式 “% 费 %” 的 意思 是 “ 费 ” 字 的 前 边 有 0 个 或 若干 个 字符 ,后 边 也 有 0 个 或 若干 
个 字符 。 表 达 式 “摘要 LIKE '% 费 %” 的 含义 是 :“ 摘 要 "字符 串 的 模式 像 *% 费 %”, 如 “ 收 
培训 费 ”“ 会 务 费 “费用 ”“ 收 辽 清 海洋 商贸 研究 所 资料 费 ”“ 提 取 差旅费 "等 都 是 满足 模式 
“% 费 %” 的 字符 串 。 

例 33 设计 SQL 语句 ,从 凭证 库 表 中 查询 摘要 以 * 费 ”结束 的 行 。 

SELECT * FROM 凭证 库 WHERE 摘要 LIKE '% 费 ' 

例 34 设计 SQL 语句 ,从 凭证 库 表 中 查询 摘要 以 “会 议 " 开 始 的 行 。 

SEIECT * FFOM 凭 证 库 WHERE 摘要 LIKE ' 会 议 s 

例 35 设计 SQL 语句 ,从 凭证 库 表 中 查询 摘要 的 第 二 个 字 是 “ 费 ” 的 行 。 

SELECT * FEOM 凭 证 库 WHERE 摘要 LIKE ' 费 $' 

这 个 例子 限制 “ 费 " 字 必须 是 字符 串 中 的 第 二 个 字 , 即 “ 费 " 字 的 前 面 有 且 仅 有 一 个 字 
符 , 而 不 管 这 个 字符 是 什么 。 模 式 ”_ 费 %” 表 达 了 这 个 含义 。 

例 36 设计 SQL 语句 ,从 凭证 库 表 中 查询 摘要 倒数 第 三 个 字 是 “ 费 ” 的 行 。 

SETIECT * FEOM 凭 证 库 WHERE 摘要 LIKE 's 费 _， 

例 37 设计 SQL 语句 ,从 会 计 科 目 表 中 查询 科目 编码 是 504 开头 的 会 计 科 目 。 

SEIECT * FROM 会 计 科目 表 weERE 科目 编码 LIKE '504%' 

当 一 个 复杂 的 表达 式 有 多 个 运算 符 时 ,运算 符 优先 级 决定 执行 运算 的 先后 次 序 。 运 
算 符 的 优先 级 见 表 2-8。 沿 箭头 方向 ,优先 级 降低 。 在 较 低 等 级 的 运算 符 之 前 先 对 较 高 
等 级 的 运算 符 求 值 。 

当 一 个 表达 式 中 的 两 个 运算 符 有 相同 的 运算 符 优先 等 级 时 ,基于 它们 在 表达 式 中 的 
位 置 对 其 从 左 到 右 进行 求 值 。 例 如 ,在 表达 式 5 一 2 十 27 中 ,在 加 号 运算 符 之 前 先 对 减 号 
运算 符 进行 求 值 。 

在 表达 式 中 可 以 使 用 括号 改变 所 定义 的 运算 符 的 优先 性 。 首 先 对 括号 中 的 内 容 进行 
求 值 ,从 而 产生 一 个 值 ,然后 括号 外 的 运算 符 才 可 以 使 用 这 个 值 。 例 如 ,在 表达 式 2 * 4 十 5 
中 , 乘 运算 符 比 加 运算 符 有 更 高 的 优先 权 , 所 以 先 对 乘 运算 符 进 行 求 值 ,表达 式 的 结果 是 
13。 在 表达 式 2* (4 十 5) 中 ,括号 使 得 加 法 首先 进行 运算 ,整个 表达 式 结果 是 18。 
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表 2-8 运算 符 的 优先 级 


运 算 符 优先 级 
十 ( 正 )、 一 ( 负 ) 
*( 乘 )、/( 除 )、%( 模 ) 
十 (加 ) 十 (串联 ) ,一 ( 减 ) 
三 ,<>=.<=.<>>、!=、!>,!<< 比 较 运 算 符 


BETWEEN*…AND.IN、LIKE、SOME、EXISTS、ALL、ANY 谓词 运算 符 


NOT 


AND 


OR 是 


如 果 表 达 式 有 以 套 的 括号 ,就 先 对 赃 套 最 深 的 表达 式 求 值 。 表 达 式 2* (4 十 (5 一 3)) 
中 包含 谋 套 的 括号 ,其 中 表达 式 5 一 3 在 嵌 套 最 深 的 那 对 括号 中 。 该 表达 式 产 生 一 个 值 
2 ,然后 加 运算 符 将 这 个 结果 与 4 相 加 ,这 样 就 得 出 一 个 为 6 的 值 , 之 后 将 6 与 2 相 乘 ,最 
后 表达 式 的 结果 为 12 。 


2.6 应 用 内 置 函 数 完成 通用 功能 
T-SQL 中 有 5 类 内 置 丽 数 : 聚合 函数 .日期 和 时 间 丽 数 .数学 函数 .字符 中 函数 和 系 
统 函 数 。 这 些 内 泗 丙 数 实现 了 一 些 通用 的 功能 ,如 求 和 、 求 平均 数 等 。 
2.6.1 聚合 郴 数 与 聚合 查询 


聚合 函数 对 一 组 值 执行 计算 并 返回 单一 的 值 。 聚 合 函 数 忽略 空 值 。 聚 合 函 数 经 常 与 
SELECT 语句 的 GROUP BY 子 句 一 同 使 用 构成 聚合 查询 。 常 见 的 聚合 函数 见 表 2-9 。 


表 2-9 常见 的 聚合 函数 


聚合 函数 功 能 聚合 函数 功 能 

sum( ) 求 和 min( ) 求 最 小 值 

avg( ) 求 平均 值 stdev( ) 统计 标准 偏差 (方差 的 平方 根 ) 
count( ) 计数 var( ) 统计 方差 

max( ) 求 最 大 值 


下 面 通过 几 个 例子 说 明 聚 合 函 数 的 用 法 。 
例 38 设计 SQL 语句 ,从 药品 表 中 查询 所 有 药品 单价 的 平均 值 。 


SETIECT avg 人 单价 ) 
FROM 药品 


例 39 设计 SQL 语句 ,从 凭证 库 表 中 查询 “科目 名 称 ” 为 “现金 "的 行 在 “借方 金额 ” 


EP 


列 上 的 平均 值 。 


SETEcT avg (借方 金额 ) 

FROM 凭证 库 

WHERE 科目 名 称 = ' 现 金 ， 

求 均值 函数 avg() 的 完整 格式 是 : avg ([ ALL | DISTINCT ] 一 表达 式 之 ) 。 该 函 
数 通 常用 来 计算 某 一 列 上 的 平均 值 ,忽略 其 中 的 空 值 。ALL 对 所 有 的 值 (无 论 是 否 重复 ) 
进行 聚合 函数 运算 ,是 默认 设置 ;而 DISTINCT 只 使 用 每 个 值 的 唯一 实例 。 其 他 聚合 函 
数 中 也 可 以 使 用 ALL 和 DISTINCT。 

例如 , 表 Tl 中 数值 型 列 Num 中 含有 一 个 空 值 ,如 下 所 示 。 


TEs 

Num Name 
陈 明 

50 张力 
70 董 庆 

那么 执行 查询 语句 : 

SELECT avg (Num) 

FRM Tl 


的 结果 为 60。 因 为 表 中 有 3 行 ,其 中 Num 取 值 不 为 空 的 行 有 2 行 ,所 以 平均 值 是 (50 十 
70) 二 2 一 60, 而 不 是 (50 十 70) 二 3 一 40。 
再 如 , 表 T2 中 的 Num 上 含有 重复 值 50, 如 下 所 示 。 


T2; 
Num Name 
50 陈 明 
50 张力 
70 董 庆 

执行 语句 : 

SELECT avg (DISTINCT Num) 

FROM 中 


的 结果 为 60。 这 是 因为 保留 字 DISTINCT 把 重复 值 去 掉 了 ,按照 (50 十 70) 二 2 进行 计 
算 , 而 不 是 按照 (50 十 50 十 70) 二 3 进行 计算 。 
例 40 设计 SQL 语句 ,从 凭证 库 表 中 查询 “借方 金额 * 列 上 的 最 大 值 。 


SETECT max (借方 金额 ) 

FROM 凭证 库 

例 41 设计 SQL 语句 ,从 凭证 库 表 中 查询 “借方 金额 ? 列 上 的 最 小 值 。 
SETECT min (借方 金额 ) 

EFCOM 凭 证 库 


二 


例 42 设计 SQL 语句 ,从 凭证 库 表 中 查询 “借方 金额 ” 列 上 的 最 大 值 和 最 小 值 。 


SETECT max( 借 方 金额 ), min (借方 金额 ) 

FROM 凭证 库 

例 43 设计 SQL 语句 ,从 凭证 库 表 中 查询 “借方 金额 列 的 总 和 。 
SEIECT sm 人 (借方 金额 ) Ps 借方 金额 汇总 

FROM 凭证 库 

例 44 设计 SQL 语句 ,从 凭 证 库 表 中 查询 “借方 金额 “贷方 金额 两 个 列 的 总 和 。 
SELECT sum( 借 方 金额 ) as 借方 金额 汇总 ,sum( 贷 方 金额 ) as 贷方 金额 汇总 

EECM 凭证 库 

例 45 设计 SQL 语句 ,从 住院 收费 表 中 查询 有 多 少 条 收费 记录 。 


SELECT count (* ) 


FFOM 住 院 收 费 
例 46 设计 SQL 语句 ,从 住院 收费 表 中 查询 10205 部 门 有 多 少 条 收费 记录 。 


SEIECT comt (* ) 
FFOM 住 院 收费 
WHERE 部 门 号 = '10205' 


count( x* ) 返回 表 中 行 的 个 数 , 包 括 重复 行 ; 而 count(DISTINCT x ) 只 统计 一 次 重复 行 。 


已 知 表 Tl 和 T2 如 下 所 示 ,Tl 表 中 Num 列 上 含有 空 值 ,T2 表 中 含有 重复 行 。 
Tl: 


Num Name 
陈 明 
50 张力 
70 董 庆 
T2: 
Num Name 
50 张力 
50 张力 
70 董 庆 


下 面 几 个 查询 语句 的 查询 结果 不 同 。 

SELECT count( * ) FROM TI1 的 查询 结果 为 3。 

SELECT count(* )FROM T2 的 查询 结果 为 3, 包 含 重 复 行 。 

SELECT countCnum) FROM T1 的 查询 结果 为 2, 这 是 因为 默认 情况 下 count() 忽 
略 空 值 。 

SELECT count(num)FROM T2 的 查询 结果 为 3, 这 是 因为 默认 统计 重复 值 。 

SELECT count(distinct num) FROM T2 的 查询 结果 为 2, 这 是 因为 不 统计 重复 值 。 
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使 用 聚合 函数 的 查询 称 为 聚合 查询 .在 没有 使 用 GROUP BY 子 句 的 情况 下 ,查询 结 
果 最 多 只 有 一 行 。 而且, 在 没有 使 用 GROUP BY 子 句 的 情况 下 ,SELECT 后 面 的 每 个 表 
达 式 都 要 使 用 聚合 函数 。 例 如 ,以 下 SQL 语句 是 错误 的 。 


SETEcT 科目 编码 , 科目 名 称 , min( 借 方 金额 ) 
FROM 凭证 库 


在 SQL 编辑 器 中 执行 ,将 返回 以 下 错误 信息 。 


服务 器 : 消息 8118, 级 别 16, 状 态 1, 行 1 


列 坚 证 库 .科目 编码 ' 在 选择 列表 中 无 效 , 因 为 该 列 未 包含 在 聚合 函数 中 ,并 且 没 有 


GROUP BY 子 句 。 


2.6.2 日 期 和 时 间 函 数 


“日 期 ” 指 含有 年 月 .日 3 个 分 量 的 数据 类 型 。“ 时 间 ” 指 含有 时 ,分 、 秒 3 个 分 量 的 数 
据 类 型 。“ 日 期 时 间 ” 指 含有 年 .月 \ 日 .时 、 分 、 秒 6 个 分 量 的 数据 类 型 。 选 择 合适 的 面向 
日 期 和 时 间 的 函数 ,可 以 针对 日 期 和 时 间 数 据 完成 期 望 的 功能 。 常 用 的 日 期 和 时 间 函 数 


及 其 功能 见 表 2-10。 


表 2-10 常用 的 日 期 和 时 间 函 数 及 其 功能 


日 期 和 时 间 函 数 


功 能 


datepart( 过 日 期 分 量 二 ,二 日期) 


以 整数 返回 指定 二 日 期 二 的 指定 二 日 期 分 量 二 


datename( 志 日 期 分 量 二 ,一 日 期 二 ) 


以 字符 串 返 回 指定 二 日 期 二 的 指定 一 日 期 分 量 二 


year( 一 日 期 二 ) 等 价 于 datepart(yy, 一 日 期 二 ) 
month( 一 日 期 过) 等 价 于 datepart(mm, 二 日 期 这 ) 
day( 过 日 期 >) 等 价 于 datepart(dd, 一 日 期 > ) 


dateadd( 一 日 期 分 量 过 ,二 整数 二 ,一 日 期 二 ) 


在 指定 二 日 期 之 的 指定 去 日 期 分 量 之 上 和 去 整 
数 之 相 加 


datediff( 一 日 期 分 量 之 ,二 开始 日 期 之 ,二 终 止 日 
期 二 ) 


按照 指定 二 日 期 分 量 二 用 二 开始 日 期 二 减 二 终 
止 日 期 二 


getdate( ) 


返回 SQL Server 所 在 机 器 的 日 期 和 时 间 


在 SQL 编辑 器 中 输入 下 面 语句 ,得 到 getdate() 函 数 的 返回 结果 : 2017-08-01 09:22: 


10. 140 。 


SETECT getdate() 


getdate() 函数 返回 当前 系统 的 日 期 和 时 间 。 可 使 用 datename() 函 数 进一步 把 其 中 
的 年 月 .日 时、 分 、 秒 等 分 量 单独 提取 出 来 。 日 期 分 量 及 其 含义 见 表 2-11。 
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表 2-11 日 期 分 量 及 其 含义 


日 期 分 量 缩 写 会 问 
year yy» yyyy 年 (1900 一 2079) 
quarter qq q 季 (1 一 4) 
month mm，m 月 (1 一 12) 
dayofyear dy，y 1 一 365 

day dd, d 1~31 

week wk, ww 周 (1 一 52) 
hour hh 小 时 (1 一 24) 
minute mi，n 分 钟 (1 一 60) 
second Ss，S 秒 (1 一 60) 
millisecond ms 毫秒 (1 一 1000) 


year() .month() 和 day() 函 数 分 别 等 价 于 datepart(yyyy, 一 日 期 过) .datepart(mm， 
去 日 期 二) 和 datepart(dd, 一 日 期 二 )。 下 面 通过 几 个 例子 说 明 有 关 日 期 时 间 函 数 的 
用 法 。 

例 47 设计 SQL 语句 ,从 凭证 库 表 中 查询 2013 年 的 凭证 。 

SETECT * 

FROM 凭证 库 

WHERE datepart (yyyy, 凭 证 日 期 ) = 2013 
或 者 使 用 等 价 的 查询 : 

SEIECT * 

FROM 凭证 库 

WHERE year (凭证 日 期 ) =2013 

例 48 设计 SQL 语句 ,从 凭证 库 表 中 查询 1 月 份 的 凭证 。 

SEIECT * 

FROM 凭 证 库 

WHERE datepart MM, 凭 证 日 期 ) =1 
或 者 使 用 等 价 的 查询 : 

SEIECT * 

FROM 凭证 库 

WHERE month ( 任 证 日 期 ) =1 

例 49 设计 SQL 语句 ,从 凭证 库 表 中 查询 每 月 1 日 的 凭证 。 


SETECT 关 


FFCOM 凭 证 库 
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WHERE datepart (dd, 赁 证 日 期 ) =1 
或 者 使 用 等 价 的 查询 : 


SEIECT 关 
FROM 凭证 库 
WHERE day( 赁 证 日 期 ) =1 


例 50 设计 SQL 语句 ,从 凭证 库 表 中 查询 2013 年 4 月 1 日 的 凭证 。 


SETECT * 
FROM 凭证 库 
WHERE year (凭证 日 期 )=2013 and month (凭证 日 期 )=4 and day( 凭 证 日 期 ) =1 


例 51 设计 SQL 语句 ,从 凭证 库 表 中 查询 2013 年 4 月 或 9 月 的 凭证 。 


SETRCT * 
FROM 凭证 库 
WHERE year( 凭 证 日 期 )= 2013 and tnth( 任 证 日 期 )= 4 or month( 任 证 日 期 )=9) 


例 52 查询 当前 日 期 后 第 9 日 的 日 期 。 
SELECT dateada(da,9,getdate()) AS 第 9 日 ' 
例 53 假定 某 人 的 生日 是 1971 年 2 月 20 日 ,计算 其 今年 的 年 龄 。 


SELECT datediff (yy，'1971- 02- 20', getdate()) AS 年 龄 


2.6.3 ”数学 函数 


数学 函数 (如 取 绝 对 值 函数 abs() 等 ) 完 成 与 数学 有 关 的 计算 。 常 见 的 数学 函数 及 其 
功能 见 表 2-12。 


表 2-12 常见 数学 函数 及 其 功能 


数学 函数 

函数 样 例 返回 值 i 
abs(—1.0) 1.0 绝对 值 
ceiling( $ 123. 45) 124 大 于 或 等 于 所 给 数字 表达 式 的 最 小 整数 
exp(2.1) 8. 1661699125676517 返回 所 给 的 float 表达 式 的 指数 值 
floor(123. 45) 123 返回 小 于 或 等 于 所 给 数字 表达 式 的 最 大 整数 
log(5. 175643) 1. 6439635826406203 返回 给 定 float 表达 式 的 自然 对 数 
log10(100) 2.0 返回 给 定 float 表达 式 的 以 10 为 底 的 对 数 
power(2, 3) 8 全 
rand(17) 0.713890120753055 返回 0~1 的 随机 float 值 ,参数 为 种 子 


慎 印 分 听 : 风 的 国 到 内 载 用 


续 表 
数学 函数 
功 能 
函数 样 例 返回 值 
round(123. 4545, 2) 123. 4500 四 舍 五 人 ,小 数 点 后 保留 2 位 
round(150. 75, 0) 151. 00 四 舍 五 人 ,小 数 点 后 保留 0 位 
sign( 一 100) 人 
sign(100) 符号 函数 
sign(0) 0 
square(5) 25:0 求 平方 
sqrt(4) 2.0 求 平方 根 
pi() 返回 值 为 x, 即 3. 1415926535897936 
2.6.4 ”字符 串 函 数 


字符 串 函 数 对 字符 串 输 入 值 执 行 操作 ,返回 字符 串 或 数字 值 。 表 2-13 列举 了 字符 串 


函数 及 其 功能 。 表 中 使 用 * 


”表示 空格 字符 。 


表 2-13 字符 串 函 数 及 其 功能 


字符 串 函 数 

函数 样 合 返回 值 人 
left( 法 律 法 规 ,2) 法 律 返回 从 字符 串 左边 开始 指定 个 数 的 字符 
right( 法律 法 规 条 例 ,2) 条 例 从 指定 字符 串 右边 开始 数 ,截取 2 个 字符 
substring( 法 律 法 规 条 例 ，2，, 3) “| 律 法 规 sei a 
len( 法 律 法 规 ) 4 返回 给 定 字符 囊 表达 式 的 字符 (而 不 是 
len( 口 口 口 口 法 律 法 规 DDDD〉 |8 字 节 ) 个 数 ,其 中 不 包含 尾随 空格 
itim( 口 口 口 口 法 律 法 规 ) 法 律 法 规 删除 指定 字符 囊 中 的 起 始 空 格 
rtrim( 口 口 口 口 法 律 法 规 口 口 口 口 》 | 口 口 口 口 法 律 法 规 | 删除 指定 字符 串 中 的 尾随 裤 格 
replace( 法 律 法 规 , 法规, 条 文 》 | 法 律 条 文 使 用 条 文 将 换 法 律 法 规 中 的 法 规 
replicate( 法 律 3) 法 律 法 律 法 律 。 ”| 重复 指定 字符 串 法 律 3 次 
reverse( 法 律 法 规 ) 法 律 法 规 反 转 指定 的 字符 串 


charindex( 法 规 ', 法 律 法 规 条 例 ”) 


3 


返回 字符 串 中 某 个 指定 的 子 串 出 现 的 开 
始 位 置 


stuff() 


用 另 一 子 串 填充 字符 串 指 定位 置 长 度 的 
子 串 


str(123.45, 6, 1) 


123.5 


把 数值 123. 45 转换 成 字符 , 共 6 个 字符 
位 置 ( 含 小 数 点 位 置 ) ,小数 点 后 1 个 位 
置 ,四 舍 五 入 
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续 表 
字符 串 函 数 
功 能 
函数 样 例 返回 值 
3 返回 字符 表达 式 最 左 端 字符 的 ASCIT 
码 值 

char(65) A 用 于 将 ASCII 码 转 换 为 字符 
lower(CABc) abc 把 字符 串 全 部 转换 为 小 写 
upper('ABc’) ABC 把 字符 串 全 部 转换 为 大 写 


下 面 通 过 几 个 例子 说 明 字 符 串 函数 在 查询 设计 中 的 应 用 。 

例 54 设计 SQL 语句 ,从 凭证 库 表 中 查询 "摘要 ”的 第 二 个 字 是 “ 费 ” 的 行 。 

SETECT * FROM 凭 证 库 WHERE substring 师 要 ,2,1) = ' 费 ' 

例 55 设计 SQL 语句 ,从 凭证 库 表 中 查询 “科目 名 称 ” 的 前 2 个 字 是 “现金 ”的 行 。 


SETBCT * 
FROM 凭证 库 
WHERE substring 科目 名 称 ,12) = ' 现 金 ' 


例 56 将 数值 123. 45 转换 为 长 度 为 6 的 字符 串 , 小 数 部 分 四 舍 五 人 保留 一 位 。 
SETBCT str (123.45, 6, 1) 


结果 为 : 123.5 
这 里 的 参数 6 表示 字符 串 的 总 长 度 ,总 长 度 包括 小 数 点 .符号 .数字 或 空格 ,默认 值 为 


。 参 数 1 表示 小 数 点 右边 的 位 数 。 


例 57 设计 SQL 语句 ,从 凭证 库 表 中 查询 “摘要 ”的 第 1 个 字 是 “ 费 ” 的 行 。 
SEIECT * FROM 凭证 库 WHERE left 摘要 ,1) = ' 费 ' 


这 里 ,left (摘要 , 1 ) 返 回 从 “摘要 ”左边 开始 的 1 个 字符 。 
例 58 设计 SQL 语句 ,从 凭证 库 表 中 查询 “科目 编码 ”为 101 的 行 及 其 下 级 科目 的 行 。 


SELECT * FROM 凭证 库 WHERE left 科目 编码 ,3)= '101" 

例 59 设计 SQL 语句 ,从 凭证 库 表 中 查询 “科目 编码 ”以 5” 开头 的 行 。 

SELECT * FEOM 赁 证 库 WHERE left 科目 编码 ,1)='5' 

例 60 设计 SQL 语句 ,从 凭证 库 表 中 查询 有 一 级 科目 (一 级 科目 为 3 位 ) 的 行 。 
SETRCT * FEOM 凭 证 库 WHERE len( 科 目 编码 )=3 

例 61 设计 SQL 语句 ,从 凭证 库 表 中 查询 有 二 级 科目 (二 级 科目 为 5 位 ) 的 行 。 
SETIPCT * FFOM 凭 证 库 WHERE len( 科 目 编码 )=5 

例 62 设计 SQL 语句 ,从 凭证 库 表 中 查询 一 级 科目 和 二 级 科目 的 行 。 
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SEIECT * FEEOM 凭 证 库 WHERE len( 科 目 编码 )<=5 
例 63 设计 SQL 语句 ,从 凭证 库 表 中 查询 摘要 为 “招待 费 ” 的 行 。 
SELECT * FROM 凭 证 库 WHERE rtrim 师 要 )= ' 招 待 费 ' 


2.6.5 系统 函数 


系统 函数 完成 一 些 通用 的 功能 ,如 数据 类 型 转换 等 。 数 据 类 型 转换 函数 有 下 列 两 个 。 


CssTK 表 达 式 >as < 数据 类 型 >) 把 < 表达 式 > 转 换 为 < 数据 类 型 > 
CONWERT (< 数据 类 型 > [发 度 )], < 表达 式 >) 把 < 表达 式 > 转 换 为 < 数据 类 型 > 
下 面 的 两 个 例子 说 明了 类 型 转换 函数 在 查询 设计 中 的 应 用 。 
例 64 设计 SQL 语句 ,从 凭证 库 表 中 查询 “借方 金额 * 中 含有 小 数 点 的 行 。 
SEIEcT 科目 名 称 , 借方 金额 
FROM 凭证 库 
WHERE CAST (借方 金额 AS char (20)) LIKE '%.%' 
等 价 的 查询 语 也 可 以 是 : 
SEIEBcT 科目 名 称 , 借方 金额 


FFOM 凭证 库 

WHERE CONVERT (char (20), 借方 金额 ) LEE '% .%' 

例 65 设计 SQL 语句 ,从 凭证 库 表 中 查询 凭证 日 期 为 2013 年 的 行 。 

sEIECT 科目 编码 ,科目 名 称 , 摘 要 ,凭证 日 期 ,借方 金额 ,贷方 金额 

FROM 凭证 库 

WHERE cast (凭证 日 期 as CHAR(19)) like '%2013%' 

系统 函数 ISNULL ( 所 被 蔡 换 的 表达 式 二 ,所 替换 表达 式 二 ) 的 意思 是 : 如 果 志 被 
替换 的 表达 式 过 为 NULL, 则 使 用 二 替换 表达 式 二 将 其 替换 ;如 果 二 被 替换 的 表达 式 二 
不 为 NULL, 就 返回 该 表达 式 的 值 。 如 果 数 据 中 可 能 包含 空 值 , 但 不 想 在 查询 结果 中 出 
现 空 值 ,可 以 创建 查询 将 空 值 转换 成 其 他 值 。 下 面 的 示例 显示 了 会 计 科 目 表 中 的 所 有 科 
目 , 如 果 某 科目 的 上 级 科目 编码 为 NULL, 则 显示 “无 ”。 


SEIECT 科目 编码 ,科目 名 称 , ISNUILL( 上 级 科目 编码 ,' 无 ') 
FROM 会 计 科目 表 


2.7 基于 单 表 的 查询 技术 


单 表 查询 即 从 单个 表 中 查询 满足 条 件 的 行 。 满 足 什么 样 的 条 件 , 需 要 使 用 WHERE 子 句 
指定 ;如 果 需 要 把 查询 结果 保存 在 表 中 , 则 使 用 INTO 子 句 ;如 果 需 要 小 计 , 不 是 仅仅 一 个 总 
计 , 则 使 用 GROUP BY 子 句 进行 分 组 ;如 果 需 要 对 分 组 的 结果 进一步 筛选 , 则 使 用 HAVING 
子 句 ;如 果 想 对 结果 集 排序 , 则 使 用 ORDER BY 子 句 。SELECT 语句 的 主要 子 句 如 下 。 


EP 


sEIEcT < 项 目 列表 > 

[ Imo < 新 表 >] 

FRCOM < 表 > 

[WHERE < 检索 条 件 >] 

[ GROUP BY < 分 组 表达 式 >] 

[ HAVING < 检索 分 组 结果 的 条 件 表 达 式 >] 

[ CRIER BY [ALL] < 排序 表达 式 > [ Rsc | resc] ] 


下 面 分 别 说 明 这 几 个 子 句 的 使 用 方法 。 
2.7.1 WHERE 子 句 
使 用 SELECT 和 FROM 仅 可 以 从 表 中 检索 所 有 行 。 例 如 : 


SEIECT * FFOM 凭 证 库 
就 从 凭证 库 表 中 查询 所 有 行 。 若 要 查找 凭证 库 表 中 所 有 借方 金额 不 低 于 10000 元 的 行 ， 
则 要 使 用 WHERE 子 句 指定 检索 条 件 。 
SEIECT * FROM 凭证 库 WHERE 借方 金额 >=10000 
WHERE 子 句 中 的 条 件 可 以 包含 以 下 运算 符 。 
1) 比较 运算 符 ( 如 = 一、 到 之 .过 和 > 等 ) 
例如 ,从 凭证 库 表 中 查询 借方 金额 大 于 10000 元 的 行 。 
SETECT * FEOM 凭 证 库 WHERE 借方 金额 > 10000 
2) 范围 (BETWEEN…AND 和 NOT BETWEEN…AND) 
例如 ,从 凭证 库 表 中 查询 2013 年 12 月 1 日 至 10 日 期 间 的 行 。 
SELECT * FROM 凭证 库 WHERE 凭证 日 期 BETWEEN '2013- 12- 01' RND '2013- 12- 10' 
3) 一 组 值 (IN 和 NOT IN) 
例如 ,从 凭证 库 表 中 查询 凭证 号 为 10、11、12、13 和 14 的 行 。 
SEIECT * FROM 凭证 库 WHERE 凭证 号 IN ('10','11','12','13','14') 
再 如 ,从 凭证 库 表 中 查询 “科目 名 称 ” 为 银行 存款 、 现 金 和 应 交 营 业 税 的 行 。 


SEIECT * 
FFCOM 凭证 库 
WHERE 科目 名 称 IW(" 银 行 存款 ',，' 现 金 ',，' 应 交 营业 税 ') 


4) 模式 匹配 (LIKE 和 NOT LIKE) 
例如 ,从 凭证 库 表 中 查询 “科目 名 称 ” 不 是 以 “现金 ”结尾 的 行 。 


SEIECT * FROM 凭 证 库 WHERE 科目 名 称 NOT LIE '# 现 金 ， 


5) 空 值 IS NULL 和 IS NOT NULL) 
例如 ,从 会 计 科目 表 中 查询 所 有 的 一 级 科目 (无 上 级 科目 编码 )。 
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SEIECT * FROM 会 计 科 目 表 WHERE 上 级 科目 编码 IS NOIL 

6) 上 述 条 件 的 组 合 (AND、OR、NOT) 

例如 ,从 凭证 库 表 中 查询 科目 代码 以 101 开头 且 借方 金额 不 小 于 10000 元 的 行 的 摘要 。 
SETEcT 摘要 FFOM 凭证 库 WERE 科目 编码 LIKE '101%$ ' RD 借方 金额 >= 10000 


2.7.2 ORDER BY 子 名 


如 果 不 使 用 ORDER BY 子 句 ,查询 返回 的 结果 顺序 就 是 行 录入 时 的 顺序 。 如 果 和 希 
望 以 某 种 顺序 返回 查询 结果 ,如 按照 金额 大 小 .日 期 等 排序 ,这 时 就 要 用 到 ORDER BY 
子 句 。 

排序 可 以 是 升序 (ASC) 的 ,也 可 以 是 降序 (DESC) 的 。 如 果 没 有 指定 是 升序 ,还 是 降 
序 , 默 认为 ASC。NULL 作为 最 小 值 处 理 。 

下 面 通过 几 个 例子 说 明 ORDER BY 子 句 的 用 法 。 

例 66 设计 SQL 语句 ,从 凭证 库 表 中 查询 所 有 凭证 ,查询 结果 按照 借方 金额 由 小 到 
大 排列 。 

SETECT * FROM 凭证 库 ORDER BY 借方 金额 

注意 ,ORDER 和 BY 必须 同时 使 用 ,默认 是 升序 排序 (ASC)。 下 面 的 查询 语句 与 上 
面 的 查询 效果 相同 。 

SEIECT * FFOM 凭 证 库 ORDER BY 借方 金额 asc 

如 果 要 降序 排序 , 则 使 用 DESC。 

SELECT * FROM 凭证 库 CRDER BY 借方 金额 [Esc 

查询 结果 以 升序 排列 或 降序 排列 ,并 不 意味 着 数据 库 表 中 的 行 也 重新 排序 了 。 

以 上 例子 仅 按照 一 个 列 排序 ,也 可 以 按照 多 个 列 排序 。 例 如 : 

SEIECT * FROM 凭证 库 ORDER BY 借方 金额 ,科目 编码 

该 查询 结果 首先 按照 “借方 金额 排序 ,对 于 “借方 金额 * 相 同 的 行 , 再 按照 * 科 目 编码 ” 
排序 。 

如 果 按 照 多 个 列 排序 , 则 列 的 顺序 不 同 , 排 序 结 果 也 不 同 。 

SELECT * FROM 凭证 库 CRDER BY 科目 编码 , 借方 金额 

上 例 中 都 是 科目 编码 和 借方 金额 的 升序 排序 ,如 果 要 按照 科目 编码 升序 排序 ,相同 科 
目 编码 的 行 按照 借方 金额 降序 排序 , 则 使 用 如 下 语句 。 

SELECT * FROM 凭证 库 CRDER BY 科目 编码 ,借方 金额 FEsc 

使 用 TOP 关键 字 可 以 只 显示 查询 结果 集 前 面 或 后 面 的 少数 几 个 行 。TOP 关键 字 通 
常 与 排序 子 句 结合 使 用 。 其 语法 格式 为 


TOP n [bercent] [WITH TIES] 
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其 中 ,n 为 非 负数 。TOP n 表示 返回 查询 结果 集 的 前 n 行 ;TOP n percent 表示 返回 
查询 结果 集 的 前 n% 行 ;WITH TIES 表示 如 果 最 后 一 行 还 有 与 之 在 排序 字段 上 取 值 相同 


的 行 , 则 仍然 将 其 放 到 结果 集中 (这 可 能 使 得 查询 结果 的 总 行 数 超过 n) 。 


例 67 设计 SQL 语句 ,从 药品 表 中 查询 最 贵 的 10 种 药品 的 编号 和 单价 。 


SETECT TOP 10 药品 编号 , 单价 FECM 药品 CRIER BY 单价 TEsc 


例 68 从 门诊 收费 明细 表 中 查询 “单价 ”最 高 的 前 4 行 。 


SETECT TOP 10 门诊 流水 号 ,单价 FROM 门诊 收费 明细 CRER BY 单价 FEsc 


结果 集 为 

门诊 流水 号 单价 
25587010014 1600.0000 
25587010018 1600.0000 
25587010020 1600.0000 
25549010075 840.0000 


如 果 使 用 WITH TIES: 


SETECT TOP 4 WITH TTES 门诊 流水 号 , 单价 FROM 门诊 收费 明细 


ORDER BY 单价 [ESC 


则 结果 集 变 为 
门诊 流水 号 。 单价 
25587010014 1600.0000 
25587010018 1600.0000 
25587010020 1600.0000 
25583010010 840.0000 
25583010010 840.0000 
可 以 看 到 ,第 4 行 的 单价 值 为 “840”, 由 于 表 中 还 有 一 行 的 单价 为 “840”, 因 此 “WITH 
TIES” 就 把 该 行 显示 出 来 了 。 
2.7.3 GROUP BY 子 句 
假设 已 有 “库存 表 ”, 表 中 有 品名 、 颜 色 和 数量 3 列 ,数据 如 下 。 
品 名 颜 色 数 量 藏 考 颜 色 数 量 
钢笔 蓝 色 124 铅笔 红色 210 
钢笔 红色 223 铅笔 红色 100 
钢笔 蓝 色 101 铅笔 蓝 色 100 


下 面 通过 几 个 例子 说 明 如 何 对 * 库 存 ? 表 进行 分 组 查询 。 
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例 69 查询 库存 表 中 有 几 个 “品名 ”。 
SEIECT 品名 FEOM 库 存 GROUP BY 品名 


结果 集 为 


例 70 按照 "品名 ”小 计 其 数量 。 


SEIECT 品 名 , sum 数量)ns 小 计 FROM 库存 GEOUP BY 品名 


结果 集 为 

品名 小 计 
钢笔 448 
铅笔 410 


其 中 ,品名 “钢笔 ”的 小 计 为 448, 这 就 是 “库存 表 中 品名 为 “钢笔 "的 3 个 数量 124、 
223、101 之 和 。 

GROUP BY 关键 字 后 面 跟着 分 组 列 。GROUP BY 子 句 决定 结果 集中 的 行 ;每 个 结 
果 集 行 都 对 应 一 个 分 组 。 

如 果 使 用 了 GROUP BY 子 句 ,SELECT 子 句 中 出 现 的 表达 式 要 么 是 分 组 列 , 要 么 是 
聚合 函数 。 下 面 的 查询 语句 中 由 于 出 现 了 非 分 组 列 “ 科 目 名 称 ”, 因 此 会 出 错 。 


SETBcT 科目 编码 , 科目 名 称 ，sum 人 (借方 金额 ) PS 小 计 
FRCM 凭证 库 
GROUP BY 科目 编码 


如 果 SELECT 语句 中 既 有 WHERE 子 句 ,也 有 GROUP BY 子 句 , 则 先 根 据 
WHERE 子 句 执行 筛选 ,对 于 满足 条 件 的 记录 ,再 根据 科目 编码 进行 分 组 。 例 如 


SEIECT 科目 编码 ,sam 人 (借方 金额 ) as 小 计 
FFCOM 凭证 库 

WHERE 借方 金额 >10000 

GROUP BY 科目 编码 


当 SELECT 语句 中 有 多 个 分 组 列 时 , 则 按照 分 组 列 的 顺序 依次 进行 分 组 。 例 如 , 查 
询 语句 : 


SETEcT 科目 编码 ,会 计 月份 ,sm 人 (借方 金额 ) ns 小 计 
FFCOM 凭 证 库 

WHERE 借方 金额 >10000 

GROUP BY 科目 编码 ,会计 月 份 
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中 有 两 个 分 组 列 “ 科 目 编码 和” 会计 月 份 ”, 那 么 先 按照 “科目 编码 ”分 组 ,对 于 每 个 分 组 ， 
再 根据 会 计 月 份 进行 分 组 ,如 图 2-4 所 示 。 
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图 2-4 短 选 .分 组 执行 过 程 


在 SELECT 子 句 中 可 以 同时 使 用 多 个 聚合 函数 。 例 如 ,下 面 的 查询 使 用 了 sum() 和 
count() 两 个 聚合 函数 。 


SEIECT 科目 编码 ,sum( 借 方 金额 ) AS 小 计 ，count (借方 金额 ) Rs 行 数 
FROM 凭证 库 

WHERE 借方 金额 >10000 

GROUP BY 科目 编码 


对 于 分 组 后 的 查询 结果 集 , 还 可 以 使 用 ORDER BY 子 句 排序 。 例 如 : 


SEIECT 科目 编码 ,sum( 借 方 金额 ) as 小 计 ,count (借方 金额 ) rs 行 数 
FROM 凭证 库 

WHERE 借方 金额 > 10000 

GROUP BY 科目 编码 

ORIER BY 科目 编码 


如 果 分 组 列 包含 一 个 空 值 ,那么 该 行将 成 为 结果 中 的 一 个 分 组 ;如 果 分 组 列 包含 多 个 
空 值 ,那么 这 些 空 值 将 放 在 一 个 分 组 中 。 假 设 “库存 " 表 中 的 数据 如 图 2-5 所 示 。 


id 品名 颜色 数量 
1 钢笔 蓝 色 124 
钢笔 红色 223 
3 钢笔 蓝 色 101 
4 铅笔 红色 210 
5 铅笔 红色 100 
6 铅笔 蓝 色 100 
学 NULL 蓝 色 150 
8 NULL 红色 150 


图 2-5 含有 空 值 的 库存 表 
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执行 下 面 的 SQL 语句 : 


SEIECT 品 名 ,， sum 数量 ) FROM 库存 GROUP BY 品名 


查询 结果 集 为 
品名 (无 列 名 ) 
NOLD 300 

钢笔 448 

铅笔 410 


其 中 ,所 有 含有 空 值 的 行 归 到 了 一 个 分 组 中 。 
2.7.4 HAVING 子 句 


HAVING 子 句 用 于 对 分 组 进行 过 滤 , 它 的 功能 类 似 于 WHERE 子 句 ,但 它 用 于 组 ， 
而 不 是 单个 行 。WHERE 子 句 的 检索 条 件 在 进行 分 组 之 前 应 用 ,而 HAVING 检索 条 件 
在 进行 分 组 后 应 用 。HAVING 需要 与 GROUP BY 子 句 一 起 使 用 ,不 能 单独 出 现 。 

例 71 查找 最 大 借方 金额 大 于 10000 元 的 科目 的 编码 和 最 大 借方 金额 。 


SEIECT 科目 编码 , max (借方 金额 ) AS 最 大 借方 金额 
FROM 凭证 库 

GROUP BY 科目 编码 

HAVING max (借方 金额 ) > 10000 

ORDER BY max( 借 方 金额 ) 


注意 ,HAVING 后 面 的 条 件 应 是 对 聚合 特性 的 约束 ;HAVING 子 句 中 的 聚合 函数 
未 必 一 定 出 现在 SELECT 子 句 中 。 例 如 ,查找 最 大 借方 金额 大 于 10000 元 ,而 且 借方 金 
额 的 个 数 大 于 1 个 的 那些 行 ,只 显示 科目 编码 和 最 大 借方 金额 列 。 

SEIECT 科目 编码 , max (借方 金额 ) AS 最 大 借方 金额 

FPFOM 凭证 库 

GROUP BY 科目 编码 

HAVING max( 借 方 金额 ) > 10000 AND count (借方 金额 )>1 


例 72 组 合 使 用 GROUP BY、HAVING 和 WHERE。 将 “凭证 库 ” 表 中 2013 年 12 
月 1 日 和 2013 年 12 月 10 日 之 间 的 行 按照 科目 编码 分 组 计算 借方 金额 小 计 , 要 求 结果 集 
中 的 借方 金额 小 计 大 于 50000 元 ;并 按照 科目 编码 升序 排序 。 

SEIECT 科目 编码 ,sum( 借 方 金额 ) as 小 计 

EFCOM 凭 证 库 

WHERE 凭证 日 期 between '2013- 12- 01' and '2013- 12- 10" 

GROUP BY 科目 编码 

HAVINS sum 人 (借方 金额 ) > 50000 

ORDER BY 科目 编码 


WHERE.GROUP BY 和 HAVING 子 句 的 作用 和 执行 顺序 如 下 : WHERE 子 句 用 
来 筛选 FROM 子 句 指定 的 数据 源 ;GROUP BY 子 句 用 来 对 WHERE 子 句 产 生 的 结果 进 
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行 分 组 ;HAVING 子 句 用 来 对 分 组 后 的 结果 再 进行 筛选 ,如 图 2-6 所 示 。 
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2-6 WHERE.GROUP BY 和 HAVING 子 句 的 作用 和 执行 顺序 


2.7.5 持久 化 查询 结果 


T-SQL 允许 把 SELECT 语句 的 结果 集 存放 到 新 表 中 。 创 建新 表 使 用 INTO 子 句 。 
新 创建 的 数据 表 的 属性 列 由 SELECT 语句 的 目标 列表 达 式 确定 ,属性 列 的 列 名 、 数 据 类 
型 以 及 在 表 中 的 顺序 都 与 SELECT 语句 的 目标 列表 达 式 相同 。 新 表 的 行 数 据 也 来 自 
SELECT 语句 的 查询 结果 。 例 如 ,使 用 INTO 子 句 创建 一 个 新 表 “ 药 品 代码 名 称 对 照 ”， 
存放 药品 表 中 的 药品 编号 和 名 称 两 列 。 

SEIECT 药品 编号 , 名称 

INIO 药品 代码 名 称 对 照 

FROM 药品 

通常 情况 下 ,INTO 子 句 的 主要 作用 是 创建 一 个 临时 表 。 因 为 使 用 INTO 子 句 创建 
的 表 并 不 保留 原 表 中 已 定义 好 的 各 种 约束 ,因此 一 般 不 使 用 INTO 子 句 创建 永久 表 。 创 
建 临时 表 要 求 表 名 的 前 面 有 "# "前 级 。 例 如 : 

SEIECT 部 门 号 RS 部 门 ,ooONT(* ) Ps 收费 次 数 

INIO # 部 门 收费 次 数 对 照 


FROM 门诊 收费 
GROUP BY 部 门 号 


临时 表 被 创建 在 系统 数据 库 tempdb 中 。 


2.8 多 表 查 询 技 术 


在 关系 数据 库 中 ,为 了 避免 元 余 , 数 据 通 常 分 布 在 不 同 的 表 中 。 为 了 从 两 个 或 多 个 具 
有 逻辑 关系 的 表 中 查询 ,就 要 使 用 连接 运算 并 指定 连接 条 件 。 连 接 运 算 的 语法 为 


FROM < 表 ]> “< 连接 运算 > < 表 2> [ON < 连接 条 件 >] 


其 中 ,二 表 1 过、 去 表 2 二 指出 参与 连接 操作 的 表 名 。 连 接 可 以 对 同一 个 表 操 作 , 也 可 
以 对 多 表 操 作 。 对 同一 个 表 操作 的 连接 又 称 作 自 连 接 。 

连接 运算 有 3 种 类 型 : 交叉 连接 、 内 连接 和 外 连接 。 交 叉 连接 (CROSS JOIN) 返 回 参 
与 连接 运算 的 两 个 表 中 所 有 数据 行 的 笛 卡 儿 积 ,结果 集合 中 的 行 数 等 于 第 一 个 表 中 的 数 
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据 行 数 乘 以 第 二 个 表 中 的 数据 行 数 。 

内 连接 (INNER JOIN) 使 用 比较 运算 符 进 行 表 间 列 值 的 比较 ,返回 参与 连接 的 两 个 
表 中 与 连接 条 件 相 匹配 的 行 。 

外 连接 分 为 左 外 连接 (LEFT JOIN)\ 右 外 连接 (RIGHT JOIN) 和 全 外 连接 (FULL 
JOIN)3 种 。 与 内 连接 不 同 的 是 ,外 连接 不 只 列 出 与 连接 条 件 相 匹 配 的 行 ,还 列 出 左 表 
( 左 外 连接 时 ) 、 右 表 ( 右 外 连接 时 ) 或 两 个 表 ( 全 外 连接 时 ) 中 所 有 符合 WHERE 子 句 


的 行 。 
ON 子 句 指出 连接 条 件 。 
2.8.1 交叉 连接 
交叉 连接 不 需要 与 ON 子 句 配 套 使 用 。 例 如 ,已 知 表 T1 和 表 T2,TIl 表 有 如 下 3 行 。 
A B A B 
10 T1-1 30 T1-3 
20 T1-2 


T2 表 有 如 下 2 行 。 


A B C A B C 


10 T2-1 100 20 T2-2 200 


交叉 连接 Tl 和 T2 的 语句 为 


SEIECT * FROM Tl CROSS PN 2 


结果 集 为 
A B A B © 
10 Tl-1 10 Tl-1 100 
10 TIlL-1 20 T2-2 200 
20 T1-2 10 T2-1 100 
20 T1-2 20 T2-2 200 
30 T1-3 10 T2-1 100 
30 T1-3 20 T2-2 200 


Tl 中 有 3 行 ,T2 中 有 2 行 ,两 个 表 的 交叉 连接 产生 3X2= 6 行 。 可 见 , 交 叉 连 接 产 
生 行 的 所 有 可 能 组 合 。 在 实践 中 并 不 经 常 使 用 交叉 连接 ,但 是 交叉 连接 展示 了 所 有 连接 
的 组 合 性 质 ,并 把 参与 连接 的 所 有 表 的 列 整合 在 一 起 ,包括 其 中 的 重复 列 。 


2.8.2 内 连接 
内 连接 查询 在 交叉 连接 基础 上 进行 筛选 , 找 出 满足 连接 条 件 的 行 。 内 连接 可 分 等 值 
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连接 和 不 等 值 连接 。 等 值 连接 是 在 连接 条 件 中 使 用 等 于 号 (二 =) 运算 符 比较 连接 条 件 涉及 
的 列 ;不 等 值 连接 是 在 连接 条 件 使 用 除了 等 于 号 (二 =) 运算 符 以 外 的 其 他 比较 运算 符 比较 
连接 条 件 涉 及 的 列 。 这 些 运算 符 包 括 盖 .> 一 二 一 二、! 二 :< 和 <<>。 


假设 当前 Tl 表 中 有 如 下 5 行 。 T2 表 中 有 如 下 3 行 。 
A B A B Cc 
10 TIl-1 10 T2-1 100 
20 T1-2 20 T2-2 200 
30 T1-3 40 T2-3 400 
20 T1-4 
20 T1-5 


把 Tl 表 中 和 T2 表 中 在 A 列 上 取 值 相同 的 行 连接 在 一 起 , 即 等 值 连接 表 Tl 和 T2 
的 查询 语句 为 
SEIECT * FRM Tl PN T2 ON TIA=TZA 


结果 集 如 图 2-7 所 示 。 


图 2-7 等 值 连接 


在 列 A 上 等 值 连接 的 结果 使 得 Tl 中 在 列 A 上 取 值 为 10 的 行 与 T2 中 在 列 A 上 取 
值 为 10 的 行 连接 成 结果 集中 的 一 行 ;T1 中 在 列 A 上 取 值 为 20 的 行 与 T2 中 在 列 A 上 取 
值 为 20 的 行 连接 成 结果 集中 的 一 行 。 

上 述 内 连接 查询 还 可 以 写成 如 下 形式 。 


SEIECT * EECM Tl, T2 WHERE TI.A=T2.A 
上 述 查 询 结 果 中 包括 了 两 个 表 的 全 部 属性 ,如 果 查 询 结 果 只 包括 T1. A、T1l. B、 
T2.B, 则 相应 的 查询 语句 如 下 。 


SEIECT Tl.A, TI.B, T2.B 
FRM TI PN TP CN TA=TA 


注意 ,由 于 在 两 个 表 中 都 有 列 A、 列 B, 所 以 要 在 SELECT 子 句 中 通过 二 表 名 二 . 
二 列 名 二 指明 查询 结果 中 的 列 来 自 哪个 表 。 
再 看 一 个 例子 。 在 门诊 收费 表 中 只 有 部 门 号 .没有 部 门 名 称 。 如 果 和 希望 在 结果 集中 
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包含 每 笔 门 诊 收费 的 “部 门 名 称 ”, 则 需要 把 门诊 收费 表 及 部 门 表 连 接 起 来 。 


FFOM 门诊 收费 “com 部 门 oy 门诊 收费 .部门 号 = 部 门 部门 号 
去 掉 不 关心 的 列 , 并 把 部 门 表 中 的 部 门 名 称 移 到 “门诊 收费 ” 表 的 部 门 号 后 面 : 


sELECT 门诊 流水 号 , 门诊 收费 部门 号 , 名 称 , 收费 日 期 

FROM 门诊 收费 ”Jom 部 门 oy 门诊 收费 .部 门 号 = 部 门 .部门 号 

在 上 例 中 重复 书写 表 名 “门诊 收费 ”很 烦琐 ,为 了 简化 书写 ,可 在 FROM 子 句 中 通过 
AS 为 表 指 定 别名 。 


SEIECT 门诊 流水 号 ,M. 部 门 号 ,名 称 ,收费 日 期 
FROM 门诊 收费 Bs M Jo 部门 Bs B NM. 部 门 号 =B. 部 门 号 


在 这 个 例子 中 ,为 门诊 收费 表 指定 了 别名 M ;为 部 门 表 指定 了 别名 B。 注 意 , 一 旦 为 
表 指 定 了 别名 , 则 在 查询 语句 的 其 他 所 有 用 到 表 名 的 地 方 都 要 使 用 别名 ,而 不 能 使 用 原 
表 名 。 

如 果 只 关心 门诊 流水 号 为 24820010001 的 那 条 记录 , 则 可 以 在 上 面 的 SQL 语句 基础 
上 增加 WHERE 子 句 : 

SELECT 门诊 流水 号 ,M. 部 门 号 ,部 门 名 称 ,收费 日 期 


FROM 门诊 收费 Bs M om 部门 Bs B oN M. 部 门 号 =B. 部 门 号 
WHERE 门诊 流水 号 = "24820010001' 


数据 库 引 擎 执行 查询 语句 时 ,首先 为 被 连接 的 表 生 成 笛 卡 儿 积 ;然后 ,从 笛 卡 儿 积 中 
选择 满足 ON 子 句 中 连接 条 件 的 行 : 接 下 来 ,使 用 WHERE 子 句 从 中 进一步 进行 筛选 ;如 
果 有 GROUP BY 子 句 , 则 按照 指定 的 分 组 列 进行 分 组 ;如 果 有 HAVING 子 句 , 则 按照 指 
定 条 件 对 分 组 结果 进行 筛选 ;最 后 ,筛选 出 在 SELECT 子 句 中 指定 的 列 。 如 果 有 
ORDER BY 子 句 , 则 按照 排序 列 进行 排序 。 

下 面 两 个 例子 是 在 两 个 表 上 做 聚合 查询 。 

例 73 设计 查询 语句 ,按照 部 门 名 称 分 组 汇总 门诊 收费 次 数 。 

SELECT 名 称 ,count M. 门 诊 流 水 号 ) 


EFCM 门诊 收费 BM JON 部 门 MB ON M. 部 门 号 =B. 部 门 号 
GROUP BY 名 称 


例 74 设计 查询 语句 ,按照 部 门 名 称 分 组 汇总 2014 年 1 月 份 的 门诊 收费 次 数 。 


SEIECT 名 称 ,count M. 门 诊 流水 号 ) 

FROM 门诊 收费 BM JON 部 门 MB oy M. 部 门 号 =B. 部 门 号 
WHERE M. 收 费 日 期 BETWEEN '2014/01/01' AND '2014/01/31' 
GROUP BY 名 称 


连接 运输 也 可 以 涉及 3 个 或 更 多 的 表 。 
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SETECT M. 门 诊 流水 号 ,M. 项 目 编号 , N. 部 门 号 , B. 名 称 
FROM 门诊 收费 明细 2s M 

gOm 门诊 收费 as N CN M. 门 诊 流水 号 =N. 门 诊 流水 号 
Jo 部 门 BB NN. 部 门 号 =B. 部 门 号 


连接 把 两 个 或 者 两 个 以 上 表 中 的 列 整合 到 结果 集中 。 对 连接 后 的 结果 集 还 能 够 应 用 


筛选 .分 组 .排序 等 操作 。 
例如 ,假设 当前 “药品 " 表 中 有 如 下 5 行 。 


药品 编号 药品 名 称 单价 /元 
Al-1 胃 复 安 片 10 
Al-2 维生素 Bl 片 10 
Al-3 胃 每 平 30 
Bl-4 20 
B1-5 20 


“收费 明细 ” 表 中 有 如 下 3 行 。 


项 目 编号 单价 /元 数 量 项 目 编号 单价 /元 数 量 
Al-1 10 100 Al-3 30 400 
Al-2 10 200 


下 面 的 语句 用 于 查询 收费 明细 表 中 涉及 哪些 药品 。 


SEIECT * 
FRCM 收 费 明 细 om 药品 qu 收费 明细 .项 目 编号 = 药品 .药品 编号 
结果 集 为 
项 目 编号 单价 /元 数量 药品 编号 药品 名 称 单价 /元 

Al-1 10 100 Al-1 胃 复 安 片 10 
Al-2 10 200 Al-2 维生素 B1 片 10 
Al-3 30 400 Al-3 胃 每 平 30 
语句 : 
SETECT DISTINCT 药品 名 称 
FROM 收费 明细 ”oH 药品 oy 收费 明细 .项 目 编号 = 药品 .药品 编号 

的 查询 结果 为 
药品 名 称 
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维生素 乌 片 
胃 复 安 片 
胃 每 平 


连接 两 个 表 时 ,选择 什么 样 的 列 放 在 连接 条 件 中 进行 连接 呢 ? 一 般 来 说 ,应 选择 具有 
“引用 ?关系 的 列 。 例 如 ,收费 明细 表 中 的 “项 目 编号 ? 列 引 用 了 药品 表 中 的 “药品 编号 ? 列 ， 
那么 这 两 列 就 可 作为 连接 条 件 中 的 列 。 被 引用 的 列 一 般 能 够 唯一 标识 其 所 在 行 。 例 如 ， 
在 药品 表 中 ,药品 编号 ”能 够 唯一 标识 其 所 在 行 , 即 如 果 药品 编号 不 同 ,其 所 在 行 也 不 同 ; 
如 果 所 在 行 不 同 ,其 在 “药品 编号 ? 列 上 的 取 值 也 不 同 。 

由 于 收费 明细 表 中 的 “单价 "和 药品 表 中 的 “单价 "不 具有 引用 关系 ,所 以 不 能 依据 * 单 
价 "进行 连接 。 
2.8.3 自 连 接 


自 连接 是 一 种 特殊 的 连接 ,被 连接 的 两 个 表 在 物理 上 是 一 个 表 , 但 在 逻辑 上 是 两 个 表 。 

例如 ,从 “会 计 科 目 表 ” 查 询 所 有 会 计 科 目的 科目 编码 ,科目 名 称 、 上 级 科目 编码 、 上 级 
科目 名 称 。 

SEIECT M. 科 目 编码 , M. 科 目 名 称 , M. 上 级 科目 编码 , N. 科 目 名 称 RS 上 级 科目 名 称 


FRCM 会 计 科目 表 AS M JOIN 会 计 科目 表 as N on M. 上 级 科目 编码 =N. 科 目 编码 
ORDER BY M. 科 目 编码 


注意 : 如 果 连 接 列 在 某 行 上 出 现 NULL 值 , 即 使 两 个 表 的 连接 列 都 是 NULL, 连 接 


结果 也 不 会 存在 NULL。 因 为 比较 表达 式 一 侧 是 NULL 或 者 NULL = NULL 的 时 候 ， 
计算 结果 都 是 Unknown。 因 此 ,该 查询 不 包括 顶级 科目 的 信息 。 
2.8.4 外 连接 


内 连接 时 ,返回 到 查询 结果 集合 的 仅 是 符合 连接 条 件 和 查询 条 件 (WHERE 条 件 或 
HAVING 条 件 ) 的 行 。 而 采用 外 连接 时 ,返回 到 查询 结果 集合 中 的 不 仅 包含 内 连接 产生 
的 行 ,还 包括 左 表 ( 左 外 连接 时 ) 、 右 表 ( 右 外 连接 时 ) 或 两 个 连接 表 ( 全 外 连接 ) 中 的 符合 查 
询 条 件 的 数据 行 。 对 于 这 些 行 ,在 另外 一 个 表 中 没有 一 行 能 够 与 它 满足 连接 条 件 , 因 此 这 
些 行 不 会 出 现在 内 连接 中 。 

例如 ,假设 当前 Tl 表 中 有 如 下 5 行 。T2 表 中 有 如 下 3 行 。 


Tl: T2: 
A B A B C 
10 Tl-1 10 T2-1 100 
20 T1-2 20 T2-2 200 
30 Tl-3 40 T2-3 400 
20 T1-4 
20 TI1-5 
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如 果 希 望 在 结果 集中 包含 表 Tl 的 所 有 行 , 若 表 T2 中 没有 与 之 对 应 的 行 , 则 在 结果 
集中 置 为 空 ,如 图 2-8 所 示 。 


A B 10 Tl-1 10 T2-1 100 
10 Tl1-1 20 TI1-2 20 T2-2 200 
20 T1-2 30 TI-3 NULLNULL ”NULL 
30 TI-3 20 TI1-4 20 T2-2 200 
20 TI-4 20 TI-5 20 T2-2 200 
20 TI-5 
2-8 外 连接 
这 种 情况 下 使 用 左 连接 
SEIECT * 


FROM TI IEFT JOIN 只 ON NA=TA 
也 可 以 通过 右 外 连接 实现 。 

SETECT * 

FROM T2 RIGHT JOIN TM ON 中 .RAR=T2.RA 

如 果 和 希望 表 Tl 的 所 有 行 在 结果 集中 都 出 现 , 若 表 T2 中 没有 与 之 对 应 的 行 , 则 在 结 
果 集中 置 为 空 ;同时 要 求 表 T2 的 所 有 行 在 结果 集中 都 出 现 , 若 表 Tl 中 没有 与 之 对 应 的 
行 , 则 在 结果 集中 置 为 空 。 那 么 ,查询 语句 为 


SEIECT * 
FRM TIFUIL JOIN TN TA=TA 


结果 集 如 下 。 

A B A B &€ 

10 m1 10 To- 100 
20 MT-2 20 To- 200 
30 TI-3 NIL NULL NULL 
20 TI-4 20 To-2 200 
20 TI-5 20 TW-2 200 
NLL NOLL 40 To-3 400 


如 果 连 接 条 件 中 的 列 有 空 值 , 则 这 些 空 值 互 相 不 匹配 。 例 如 ,下 面 的 两 个 表 Tl 和 
T2 中 ,每 个 表 在 要 参与 连接 的 列 中 均 包 含 NULL 值 。 


Tl: 
A B A B 
10 Tl 20 T1-4 
NULL T1-2 20 T1-5 
30 T1-3 
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T2: 
A B C A B C 
10 T2-1 100 40 T2-3 400 
20 T2-2 200 NULL T2-4 600 


将 表 T1 的 列 A 中 的 值 与 表 T2 的 列 A 中 的 值 进 行 比 较 连 接 , 在 包含 NULL 值 的 列 


上 不 能 获得 匹配 结果 。 
SEIECT * FROM Tl PN T2 GON TIA=TZA 
结果 集 为 
A B A B C 
10 T1l-1 10 T2-1 100 
20 T1-4 20 T2-2 200 
20 T1-5 20 T2-2 200 
下 面 的 语句 对 这 两 个 表 进行 左 连 接 : 
SEIECT * 
FRMTI IEFT JOIN T2 QO TIA=T2A 
结果 集 为 
A B A B C 
10 T1-1 10 T2-1 100 
NULL T1-2 NULL NULL NULL 
30 T1-3 NULL NULL NULL 
20 T1-4 20 T2-2 200 
20 T1-5 20 T2-2 200 
下 面 的 语句 对 这 两 个 表 进 行 右 连接 : 
SEIECT * 
FRMT2 RIGHT JOIN TIGN Tl.A=T2.A 
结果 集 为 
A B C A B 
10 T2-1 100 10 T1-1 
NULL NULL NULL NULL T1-2 
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续 表 
A B eC A B 
NULL NULL NULL 30 T1-3 
20 T2-2 200 20 TI1-4 
20 T2-2 200 20 T1-5 
下 面 的 语句 对 这 两 个 表 进 行 全 外 连接 : 
SELECT * 
FRIMTI FU JOIN TZON Tl.A=T2.A 
结果 集 为 
A B A B © 
10 TL-1 10 T2-1 100 
NULL T1-2 NULL NULL NULL 
30 T1-3 NULL NULL NULL 
20 T1-4 20 T2-2 200 
20 T1-5 20 T2-2 200 
NULL NULL 40 T2-3 400 
NULL NULL NULL T2-4 600 


T-SQL 对 子 句 的 处 理 顺 序 是 : FROM、 ON、 JOIN、 WHERE、 GROUP BY、 
HAVING .SELECT DISTINCT .ORDERBY 和 TOP。 
最 后 介绍 一 个 较为 复杂 的 应 用 。 科 目 代 码 通常 采用 层次 编码 ,在 审计 实践 中 ,往往 需 
要 根据 某 个 具体 的 科目 编码 立刻 看 到 其 相关 的 各 级 科目 名 称 。 
例如 ,从 被 审 单位 得 到 的 会 计 科 目 表 如 图 2-9 所 示 。 


下 表 “ 会 计 科目 表 ” 中 的 数据 ， 位 置 是 人 -xl 


科目 编码 上 上 极 科 目 纲 码 名 
3030304 30303 

3030305 
30601 
30802 
30B03 


事业 收入 
鲁 上 基地 
项 目 支出 
人 员 支 出 
电话 补 下 


504010102 
50401D102 
5040101 
50401D1 


六 会 保障 豆 


图 2-9 会 计 科 目 表 


寺 动 分 而: 网 的 情 副 册 焕 轧 


如 果 希 望 以 图 2-10 形式 观察 数据 : 


科目 编码 _ 科 目 名 称 | 一 级 科目 名 称 ” 二 级 科目 名 称 。 三 级 科目 名 称 ” 四 级 科目 多 得 
01 现金 现金 现金 金 现金 "| 
[2 "102 银行 存款 银行 存款 银行 存款 银行 存款 银行 存款 

3 110 其 他 应 收 款 其 他 应 收 款 其 他 应 收 款 其 他 应 收 款 其 他 应 收 攻 
11001 预支 差旅费 其 他 应 收 寺 预支 差旅费 预支 差旅费 预支 差旅费 
[5 11002 海 渔业 协会 其 他 应 收 款 海 渔业 协会 海 渔业 协会 海 渔业 协会 

6 11003 海 立 中 心 其 他 应 收 款 海 立 中 心 海 立 中 心 海 立 中 心 

了 11004 通达 中 心 其 他 应 收获 通达 中 心 通达 中 心 | 


图 2-10 期 望 看 到 的 会 计 科目 表 


那么 ,可 应 用 连接 在 查询 编辑 器 中 执行 下 列 查询 。 


/* 

32222 编码 

任意 一 科目 所 属 一 级 科目 是 其 编码 的 前 3 位 

# 

SsEIECT A. 科 目 编码 ,A. 科 目 名 称 ， 

B. 科 目 名 称 AS 一 级 科目 名 称 ， 

Cc. 科 目 名 称 Bs 二 级 科目 名 称 ， 

D. 科 目 名 称 Ps 三 级 科目 名 称 ， 

E. 科 目 名 称 AS 四 级 科目 名 称 ， 

F. 科 目 名 称 as 五 级 科目 名 称 

INIO 会 计 科目 一 览 表 

FROM 会 计 科 目 表 as A JoIN 会 计 科目 表 as B cN B. 科 目 编码 =left (a. 科目 编码 ,3) 
Jo 会 计 科 目 表 as c GN c. 科 目 编码 =left .科目 编码 ,5) 
JoN 会 计 科 目 表 as D cN D. 科 目 编码 =left .科目 编码 ,7) 
Jo 会 计 科 目 表 BS EQNE. 科 目 编码 =lefta. 科 目 编码 ,9) 
Jo 会计 科目 表 as F oy F. 科 目 编 码 =lefta. 科 目 编码 ,11) 

CRIER BY A. 科 目 编码 

UPDaAIE 会 计 科目 一 览 表 

SET 五 级 科目 名 称 =NULL 

WHERE len( 科 目 编码 ) <11 

UPDaAIE 会 计 科目 一 览 表 

SET 四 级 科目 名 称 =NULL 

WHERE len( 科 目 编 码 ) <9 

UPDATE 会 计 科 目 一 览 表 

SET 三 级 科目 名 称 =NOLL 

WHERE len (科目 编码 ) <7 

UPDME 会 计 科 目 一 览 表 

SET 二 级 科目 名 称 =NUIL 

WHERE len( 科 目 编码 ) <5 


2.9 子 查询 技术 


子 查询 是 一 个 骨 套 在 SELECT 语句 中 的 SELECT 语句 。 应 用 子 查询 可 以 把 若干 个 


查询 语句 整合 到 一 个 查询 语句 中 。 
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2.9.1 使 用 返回 单个 值 的 子 查 询 


如 果 一 个 SELECT 语句 的 结果 集中 只 有 一 个 值 ,就 可 以 在 另外 一 个 查询 的 关系 表达 
式 中 能 入 该 SELECT 语句 。 下 面 通过 几 个 例子 说 明 。 

例 75 查询 脑 血管 科 的 门诊 收费 情况 。 

门诊 收费 表 中 只 包括 部 门 号 ,没有 部 门 名 称 ;而 题目 只 给 出 了 部 门 名 称 。 所 以 ,解决 
该 问题 可 以 分 两 步 。 

(1) 首先 ,从 部 门 表 中 根据 部 门 名 称 查 找 该 部 门 的 部 门 号 。 


SEIECT 部 门 号 
EECM 部 门 
WHERE 名 称 = ' 脑 血管 科 ' 


(2) 然后 ,在 门诊 收费 表 中 根据 部 门 号 查找 该 部 门 的 门诊 收费 记录 。 


SETECT * 
FRCM 门诊 收费 
WHERE 部 门 号 = '10201' 


子 查询 技术 可 以 将 以 上 两 个 查询 语句 合 二 为 一 : 
SEIECT * 

FROM 门诊 收费 

WHERE 部 门 号 = (SELECT 部 门 号 


FROM 部门 
WHERE 名 称 = ' 脑 血管 科 ') 


括号 内 的 查询 称 为 “ 子 查询 ”; 括 号 外 的 查询 称 为 “外 部 查询 ”。 比 较 运 算 符 (一 、 志 二 、 
二 .二 =. 二、! 请 ,!< 或 <=) 都 可 被 应 用 在 子 查询 上 .但 要 求 子 查 询 必 须 返 回 单 个 值 (一 
行 一 列 ) 。 如 果 这 样 的 子 查询 返回 多 个 值 ,SQL Server 将 显示 错误 信息 。 所 以 ,在 设计 查 
询 之 前 ,必须 对 数据 的 组 织 和 问题 的 本 质 非 常熟 悉 ,以 确保 该 子 查询 只 返回 一 个 值 。 
例 76 从 门诊 收费 明细 表 中 查询 超出 平均 金额 的 收费 记录 。 
SEIECT * 
FECM 门诊 收费 明细 
WHERE 单价 * 数量 > (SETEcT avg( 单 价 * 数量 ) 
FFOM 门诊 收费 明细 ) 
括号 中 的 SELECT 语句 ( 子 查询 ) 使 用 聚合 函数 avg. 结 果 仍 然 是 单个 值 。 
例 77 查询 与 医生 “ 刘 江 ”在 同一 部 门 的 医生 。 
SEIECT 姓名 
FRCOM 医 生 
WHERE 部 门 号 = (SELECT 部 门 号 
FROM 医生 
WERE 姓名 = ' 刘 江 J 
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该 查询 首先 执行 子 查询 ,根据 姓名 * 刘 江 ” 从 医生 表 中 查询 其 所 在 的 部 门 号 ,然后 根据 
这 个 部 门 号 从 医生 表 中 查询 该 部 门 所 有 医生 的 姓名 。 


2.9.2 使 用 返回 多 个 值 的 子 查询 


如 果子 查询 结果 含有 多 个 值 , 即 结果 集中 有 一 列 多 行 ,不 能 在 子 查询 上 使 用 比较 运算 
符 , 而 是 使 用 谓词 IN。 下 面 通过 例子 说 明 。 

例 78 如 果 有 两 个 医生 姓名 都 是 “ 刘 江 ”, 且 可 能 在 不 同 部 门 , 那 么 要 查找 与 医生 “ 刘 
江 ” 属 于 同一 部 门 的 医生 ,下 面 的 方法 更 准确 。 


sEIECT 姓名 
FROM 医生 
WHERE 部 门 号 I (SETpcT 部 门 号 
FROM 医生 
WHERE 姓名 =' 刘 江 ') 


Cy 
R&R 


这 个 查询 考虑 了 子 查 询 可 能 返回 多 个 值 ,使 用 谓词 IN 与 多 个 值 进 行 比较 ,只 要 
个 值 中 的 一 个 相等 , 则 谓词 IN 就 返回 “ 真 ”。 
例 79 查询 开 出 药品 *A010254” 的 所 有 医生 的 医生 号 。 


SELECT DISTINCT 医生 号 
FRCM 门诊 收费 
WHERE 门诊 流水 号 IN (SEIECT 门诊 流水 号 
FROM 门诊 收费 明细 
WHERE 项 目 编号 = 'A010254') 


该 语句 分 两 步 执行 : 首先 , 子 查询 返回 满足 条 件 的 门诊 流水 号 ;然后 ,这 些 值 被 代入 
外 部 查询 中 ,在 门诊 收费 表 中 查找 相 匹配 的 行 。 

例 80 查询 名 称 中 含 “ 葡 萄 糖 ? 字 样 的 门诊 收费 明细 中 的 行 。 

SEIECT * 

FFOM 门诊 收费 明细 

WHERE 项 目 编号 IN (SETpcr 药品 编号 


FFOM 药品 
WHERE 名 称 LIKE ' 必 葡萄糖 s ') 


例 81 查询 名 称 中 不 含 "葡萄 糖 ? 字 样 的 门诊 收费 明细 中 的 行 。 


SETECT * 

EFCM 门诊 收费 明细 

WHERE 项 目 编号 Nor IN (SETEcT 药品 编号 
FFOM 药品 


WHERE 名 称 LIKE "葡萄 糖 s ) 


2.9.3 应 用 子 查询 进行 存在 性 测试 
在 子 查询 上 应 用 EXISTS 关键 字 就 相当 于 进行 存在 性 测试 。EXISTS 判断 子 查询 的 
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结果 集 是 否 为 空 。 也 就 是 说 ,如 果子 查询 的 结果 集 有 1 行 或 者 多 行 , 则 EXISTS 返回 
“ 真 ”; 如 果 一 行 也 没有 , 则 EXISTS 返回 “ 假 ”"。 例 如 ,如 果 希 望 查询 哪些 “部 门 " 具 有 收费 
行为 , 则 可 以 设计 如 下 子 查询 。 


SEIECT 关 
FROM 部 门 
WHERE EXISTS (SEIECT * 

FEOM 门诊 收费 

WHERE 门诊 收费 .部 门 号 = 部 门 .部门 号 ) 
执行 过 程 : 


(1) 无 条 件 执行 外 层 查询 ,在 其 结果 中 取 第 一 行 作为 当前 行 。 

(2) 将 当前 行 中 的 “部 门 号 ”代入 子 查询 的 WHERE 子 句 中 ,执行 子 查询 。 如 果子 查 
询 的 结果 集中 的 行 数 大 于 或 等 于 1, 则 EXISTS 的 计算 结果 为 “存在 ”, 返 回 TRUE; 和 否则 ， 
EXISTS 的 计算 结果 为 “不 存在 ”, 返 回 FALSE。 

(3) 取 当 前 行 的 下 一 行 作为 当前 行 , 重 复 执行 步骤 (2) ,直到 全 部 行 被 处 理 完 。 

如 果 查 询 没 有 收费 行为 的 部 门 , 则 设计 如 下 子 查询 。 


WERE 门诊 收费 .部 门 号 = 部 门 .部 门 号 ) 


注意 : EXISTS 关键 字 前 面 没有 列 名 、 常 量 或 其 他 表达 式 ;EXISTS 后 的 子 查询 的 
SELECT 子 句 选择 列表 通常 由 星 号 ( x* ) 组 成 。 这 是 由 于 只 是 测试 是 否 存在 符合 子 查询 
中 指定 条 件 的 行 ,所 以 不 必 指 定 列 名 ; 子 查询 的 执行 次 数 由 外 部 查询 中 表 的 行 数 决定 。 每 
次 执行 子 查询 的 结果 会 随 着 外 层 查询 当前 行 的 变化 而 变化 。 

多 数 情况 下 , 子 查询 存在 一 个 等 价 的 连接 查询 。 例 如 ,查询 语句 : 

SEIECT * 

FROM 门诊 收费 

WHERE 部 门 号 = (SELECT 部 门 号 

FROM 部 门 
wHERE 部 门 名 称 = ' 脑 血管 科 ') 


也 可 以 通过 内 连接 得 到 。 


SEIECT M.* 
FROM 门诊 收费 BM JON 部 门 MB oy M. 部 门 号 =B. 部 门 号 
WHERE 部 门 名 称 = ' 脑 血管 科 * 


再 如 ,查询 语句 : 


SETIECT DISTINCT 医生 号 


EECM 门诊 收费 
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WHERE 门诊 流水 号 AN ( SETEcT 门诊 流水 号 


ORIER BY 医生 号 


也 可 以 通过 内 连接 得 到 : 


SEIECT DISTINCT 医生 号 


FFOM 门诊 收费 明细 
WERE 项 目 编号 = 'A010254') 


FROM 门诊 收费 AS M oomN 门诊 收费 明细 AS N CN M. 门 诊 流水 号 =N. 门 诊 流 水 号 


WHERE N. 项 目 编号 = 'A010254' 


CRIER BY 医生 号 


但 是 ,连接 查询 未 必 存 在 等 价 的 子 查询 , 子 查询 也 未 必 存 在 等 价 的 连接 查询 。 如 果 查 
询 结 果 的 列 涉及 多 个 表 , 则 一 般 使 用 连接 查询 。 


2.10 合 并 


UNION 运算 符 将 两 个 或 多 个 SELECT 语句 的 结果 合并 成 一 个 结果 集 。 使 用 
UNION 合并 的 结果 集 都 必须 具有 相同 的 结构 , 即 它们 的 列 数 必须 相同 ,并 且 对 应 列 的 数 
据 类 型 必须 兼容 。 假 设 T1 表 和 T2 表 如 下 。 


Ti 
A B 
10 T1-1 
20 T1-2 
30 T1-3 
20 T1-4 
20 T1-5 

和 
A B C 
10 T2-1 100 
20 T2-2 200 
40 T2-3 400 


如 果 和 希望 把 T1 表 的 所 有 行 和 T2 表 的 所 有 行 合 在 一 起 ,形成 : 
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则 使 用 UNION 合并 两 个 查询 的 结果 集 。 


SEIECT A,B 

ERCM II 

UNION 

SEIECT A,B 

ERCM T2 

UNION 的 结果 集 列 名 与 UNION 运算 符 中 第 一 个 SELECT 语句 的 结果 集中 的 列 
名 相同 。 另 一 个 SELECT 语句 的 结果 集 列 名 将 被 忽略 。 

默认 情况 下 ,UNION 运算 符 从 结果 集中 删除 重复 的 行 。 如 果 使 用 ALL 关键 字 , 那 
么 结果 中 将 包含 所 有 行 并 且 不 删除 重复 的 行 。 

再 如 ,从 “会 计 科 目 ” 表 中 查询 所 有 会 计 科目 的 科目 编码 ,科目 名 称 、 上 级 科目 编码 、 上 
级 科目 名 称 的 SQL 语句 为 

SEIECT m. 科 目 编码 ,m. 科 目 名 称 ,m. 上 级 科目 编码 ,n. 科 目 名 称 as 上 级 科目 名 称 

FROM 会 计 科目 表 asm join 会 计 科 目 表 as n on m. 上 级 科目 编码 =n. 科 目 编码 

CRIER BY m. 科 目 编码 

但 是 ,查询 结果 中 缺失 了 顶级 会 计 科 目 。 此 时 可 以 使 用 UNION 把 顶级 会 计 科目 合 
并 到 结果 集中 。 

SEIECT m. 科 目 编码 ,m. 科 目 名 称 ,m. 上 级 科目 编码 ,n. 科 目 名 称 as 上 级 科目 名 称 

FFOM 会 计 科目 表 RS m join 会 计 科目 表 Ms n on m. 上 级 科目 编码 =n. 科 目 编码 

UNION 

SEIECT 科目 编码 ,科目 名 称 ,' 无 '，' 无 ' 

FROM 会 计 科目 表 

WHERE 上 级 科目 编码 is NUIL 

CRIER BY m. 科 目 编码 


2.11 修改 数据 


修改 表 中 的 数据 包括 向 表 中 插入 一 些 行 . 改 变 一 些 行 上 的 值 或 者 删除 一 些 行 。 
2.11.1 插入 行 


INSERT 语句 实现 插入 一 些 行 。INSERT 语句 有 两 种 形式 : 一 种 是 使 用 VALUES 
子 句 ,一 次 只 能 插入 一 行 ; 另 一 种 是 插入 SELECT 子 句子 查询 的 结果 ,一 次 可 插入 
多 行 。 

使 用 VALUES 子 句 插入 一 行 的 语法 为 

INSEFT INTO < 表 名 > [(< 若 干 列 名 >)] 

VALDES (< 若干 值 > ) 


该 命令 将 单条 新 行 插入 指定 表 中 , 列 名 与 值 根据 位 置 对 应 。 
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例 82 设计 SQL 语句 ,向 部 门 表 新 增 部 门 “信息 中 心 ”, 其 部 门 号 是 5, 级 别 是 1, 不 是 
叶子 节点 。 


INSERT INIO 部 门 部 门 号 , 名 称 , 级 别 , 是 否 叶子 ) 
VAIDES ("5',' 信 息 中 心 ',1,0) 


该 语句 与 下 面 的 语句 等 价 : 

JINSERT mo 部 门 VALDES ("5', "信息 中 心 ',1,0) 
再 插入 一 部 门 “医学 影像 中 心 ”: 

INSERT INIO 部 门 VALUES ("6', ' 医 学 影像 中 心 ',1,0) 


注意 : 列 的 个 数 与 值 的 个 数 要 相等 , 且 顺 序 一 致 ,否则 会 产生 语法 错误 。 如 果 INTO 
子 句 后 没有 指定 任何 列 , 则 VALUES 子 句 后 面 的 值 的 个 数 必 须 与 表 中 列 的 个 数 相等 , 且 
类 型 顺序 一 致 ,否则 会 出 语法 错误 或 导致 赋值 不 正确 。 

例 83 设计 查询 ,向 医生 表 新 增 医生 ,姓名 为 “ 陈 淳 ”, 医 生 号 为 501 ,部门 号 为 5。 


INSERT INTO 医生 

VALUES('501', ' 陈 淳 ','5') 

再 插入 一 名 医生 * 陈 美 ”: 

INSERT INTO 医生 (医生 号 ,姓名 ) 

VALUES('502', ' 陈 美 ') 

INSERT 语句 要 满足 表 的 完整 性 约束 ,否则 执行 将 失败 。 常 见 的 约束 如 下 。 

(1) 主键 (Primary Key) 约 束 : 在 表 中 ,如 果 某 列 或 者 某 些 列 上 的 值 用 来 唯一 地 标识 
其 所 在 行 , 那 么 该 值 称 为 主键 值 ,该 列 称 为 主键 列 。 主 键 值 能 够 唯一 确定 表 中 的 每 一 行 ， 
主键 不 能 取 空 值 。 如 果 部 门 表 中 的 “部 门 号 ”是 主键 ,如 果 要 插入 的 行 的 部 门 号 在 部 门 表 
中 已 经 存在 了 , 则 插入 操作 将 失败 。 

(2) 外 键 (Foreign Key) 约 束 : 在 表 A 中 的 某 列 是 对 表 B 中 的 主键 列 的 引用 ,那么 该 
列 称 为 表 A 的 外 键 。 例如 ,医生 表 的 “部 门 号 "是 其 外 键 ,引用 部 门 表 的 “部 门 号 ”。 如 果 
要 插入 一 条 医生 的 信息 , 则 其 所 属 部 门 号 应 该 是 部 门 表 中 的 某 个 部 门 号 ,或 者 取 空 值 , 否 
则 操作 将 失败 。 

(3) 唯一 (UNIQUE) 约 东 : 有 些 属性 或 属性 组 虽然 不 是 主键 ,但 仍 可 以 限制 其 取 值 
唯一 ,对 于 这 些 属性 ,如 果 INSERT 语句 试图 插入 一 个 表 中 已 经 存在 的 值 ,将 失败 。 具 有 
UNIQUE 约束 的 列 中 不 能 出 现 重复 值 . 但 允许 出 现 一 次 空 值 。 

(4) 非 空 (NOT NULL) 约 束 : 如 果 某 字段 可 以 接受 空 值 , 则 INSERT 语句 中 可 以 忽 
略 该 字段 ,和 否则 必须 赋值 (例如 ,部 门 " 表 中 的 “名 称 ? 列 不 能 为 空 ) 。 

(5) 默认 (DEFAULT) 约 束 : 如 果 在 插入 操作 中 没有 为 具有 非 空 约束 的 列 提供 值 , 则 
取 该 值 。 
(6) 检查 CCHECK) 约 束 : 对 输入 列 或 整个 表 中 的 值 设 置 检查 条 件 , 以 限制 输入 值 
(例如 ,“ 部 门 ”* 表 中 的 “级 别 " 列 只 能 取 1、2 或 3)。 
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SELECT 语句 可 以 作为 子 查 询 嵌 套 在 INSERT 语句 中 ,用 以 插入 批量 行 。 其 语句 格 
式 一 般 为 
INSERT INro < 表 名 > [KK 若干 列 名 > )] 


例如 ,查询 每 个 部 门 门诊 收费 次 数 , 并 将 部 门 号 和 门诊 收费 次 数 放 入 一 张 新 表 “部 门 
收费 "中 。 那 么 , 先 应 用 下 面 的 语句 创建 新 表 。 


CREATE TABIE 部 门 收费 台 门 号 cnR(20) ,收费 次 数 Sr 
然后 应 用 INSERT INTO 把 SELECT 语句 的 查询 结果 集 插入 新 表 中 。 


INSERT INTO 部 门 收费 部 门 号 , 收费 次 数 ) 
SEIECT 部 门 号 , count 门诊 流水 号 ) 

FFOM 门诊 收费 

GROUP BY 部 门 号 


2.11.2 修改 行 
SQL 修改 行 的 语句 为 UPDATE。 其 一 般 语句 格式 为 


UPDATE < 表 名 > 

SET < 列 名 >=< 表 达 式 > [< 列 名 >=< 表 达 式 >1[…] 

[WHERE < 条 件 >] 

当 有 WHERE 子 句 时 ,修改 满足 指定 条 件 (WHERE 子 句 ) 的 行 ; 当 没 有 WHERE 子 
句 时 ,修改 全 部 行 。 例 如 ,把 501 号 医生 的 姓名 修改 为 “ 王 丹 ”的 语句 为 

UPDATE 医生 


SET 姓名 = ' 王 丹 ' 
WHERE 医生 号 = '501" 


又 如 ,修改 501 号 医生 的 姓名 为 “ 王 丹 晨 ” 部 门 号 为 "10101” 的 语句 为 


UPDATE 医生 
SET 姓名 = ' 王 丹 晨 ', 部 门 号 = '10101" 
WHERE 医生 号 = '501' 


把 所 有 药品 单价 上 调 5% 的 语句 为 


UPDATE 药品 

SET 单价 = 单价 * 1.05 

注意 : 在 UPDATE 语句 中 对 批量 行 的 修改 要 慎重 。 实 际 应 用 中 ,这 样 的 批量 行 往往 
数 以 万 计 , 因 此 WHERE 条 件 范围 一 定 要 设计 好 ,否则 一 旦 修改 错 了 ,要 恢复 就 比较 麻 
烦 。 一 个 稳妥 的 做 法 是 : 在 使 用 UPDATE 语句 之 前 , 先 用 SELECT 语句 将 要 修改 的 行 
找 出 来 检查 一 遍 , 确 定 正确 无 误 后 再 修改 。 

UPDATE 语句 要 满足 表 的 完整 性 约束 .否则 执行 将 失败 。 常 见 的 约 东 包括 主键 约 
东 、 外 键 约束 .唯一 性 约束 、 默 认 约 束 、 非 空 约束 、 检 查 约束 等 。 
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2.11.3 删除 行 
SQL 删除 行 的 语句 是 DELETE。DELETE 语句 的 一 般 格式 为 
TETETE FROM< 表 名 > [WHERE < 条 件 >] 


当 有 WHERE 子 句 时 ,删除 满足 指定 条 件 (WHERE 子 句 ) 的 行 ; 当 没 有 WHERE 子 
句 时 ,删除 所 有 行 ( 表 将 成 为 空 表 ) 。 

例如 ,删除 部 门 编号 为 6 的 部 门 : 

DETETE 


EECM 部 门 
WHERE 部 门 编号 = '6' 


在 DELETE 语句 中 也 可 以 应 用 子 查询 。 例 如 ,从 门诊 收费 表 中 删除 部 门 名 称 为 “ 脑 
血管 科 ” 和 “信息 中 心 ”的 行 : 
DETETE 
FROM 门诊 收费 
WHERE 部 门 号 AN (SETIPcT 部 门 号 
FROM 部门 
WHERE 名 称 = ' 脑 血管 科 ' oR 名 称 = "信息 中 心 ') 
因为 SELECT 子 查 询 得 到 的 行 一 般 不 止 一 行 ,所 以 子 查询 前 面 的 运算 符 不 能 为 
“一 ”, 应 该 用 表示 取 值 范围 的 "IN”。 
清空 部 门 收费 表 的 语句 为 
DETETE 
FFOM 部 门 收费 


删除 所 有 行 即 清空 表 中 的 数据 ,因此 不 加 WHERE 子 句 。 这 类 操作 的 执行 应 非常 小 心 。 

DELETE 语句 要 满足 表 的 完整 性 约束 ,和 否则 执行 将 失败 。 常 见 的 约束 主要 是 外 键 约 
东 。 例 如 ,医生 表 的 “部 门 号 "是 其 外 键 ,引用 了 部 门 表 的 “部 门 号 ”, 如果 要 删除 部 门 表 中 
的 某 行 ,是 否 能 够 成 功 取决 于 是 否 满足 该 参照 完整 性 所 设置 的 删除 策略 。 

男 外 ,TRUNCATE TABLE 语句 也 可 以 清空 表 , 该 语句 的 执行 速度 比 DELETE 语 
句 快 。 语法 如 下 。 


TRONCATE TABIE < 表 名 > 


2.12 应 用 DDL 管理 表 
管理 表 包 括 创 建 , 修 改 、 删 除 表 ,设置 完整 性 约束 规则 等 。 数 据 定义 语言 (DDL) 可 用 
于 对 表 的 管理 。 
定义 表 就 是 定义 表 的 名 字 、 列 的 名 字数 据 类 型 以 及 列 上 的 约束 等 。 例 如 ,定义 部 门 表 : 
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CREATE TABIE 部 门 

( 

部 门 号 nvardhar (20) PRIMARY KEY ， 

名 称 nvarchar(50) Nor NULL UNIQUE ， 

类 别 tinyint Nor NULL CHECK (类别 =1 or 类 别 =2 or 类 别 =3)， 
是 否 叶子 bit NoT NULL 

) 


其 中 ,PRIMARY KEY 指定 主键 ,主键 可 以 建立 在 单个 列 上 ,也 可 以 建立 在 多 个 列 上 。 
主键 用 以 保证 实体 完整 性 , 即 要 求 每 一 个 表 中 的 主键 字段 都 不 能 为 空 或 者 不 能 为 重复 的 值 ， 
以 起 到 行 的 唯一 标识 作用 。 对 于 每 个 表 , 只 能 创建 一 个 PRIMARY KEY 约束 ;NOT NULL 
表示 列 中 不 允许 空 值 ;UNIQUE 表示 该 列 不 能 出 现 重复 值 ;CHECK (类 别 =1 or 类 别 一 2 or 
类 别 = 3) 是 CHECK 约束 对 输入 到 部 门 表 中 的 类 别 列 的 值 的 限制 。 

以 下 是 医生 表 的 定义 语句 。 


CREATE TPEIE 医生 

医生 号 nvarchar(20) ”PRIMARY FEY ， 

姓名 nvarchar(20) NOT NULL DEFADLT ' 未 知 ' ， 

部 门 号 nvarchar(20) NOT NULL， REFERFNCES 部 门 部 门 号 ) 
ON IDETETE CRSCRTE 
CN UPDATE CRSCRDE 

) 


“REFERENCES 部 门 (部 门 号 )” 定 义 医生 表 引 用 部 门 表 的 列 “ 部 门 ”, 这 是 
FOREIGN KEY 约束 ,是 为 列 中 的 数据 提供 引用 完整 性 的 约束 。FOREIGN KEY 约束 
要 求 列 中 的 每 个 值 在 被 参照 表 中 对 应 的 被 引用 列 中 都 存在 。FOREIGN KEY 约束 只 能 
引用 被 参照 表 中 PRIMARY KEY 或 UNIQUE 约束 的 列 。 

ON DELETE CASCADE 在 外 键 约束 上 设计 “级 联 删除 "策略: 当 在 部 门 表 中 删除 某 
个 部 门 时 ,也 要 把 医生 表 中 相应 部 门 的 医生 全 部 删除 ;ON UPDATE CASCADE 在 外 键 
约束 上 设置 “级 联 更 新 "策略 : 当 修改 部 门 表 中 某 个 部 门 号 时 ,也 要 修改 医生 表 中 相应 部 
门 的 医生 所 属 的 部 门 号 。 

在 创建 FOREIGN KEY 约束 之 前 ,被 参照 表 ( 本 例 中 为 部 门 表 ) 要 先 创建 好 ,医生 表 
称 为 参照 表 。 

数据 完整 性 指 存储 在 数据 库 中 的 所 有 数据 值 均 正确 的 状态 。 如 果 数 据 库 中 存储 有 不 
正确 的 数据 值 , 则 该 数据 库 称 为 已 丧失 数据 完整 性 。 

强制 数据 完整 性 可 确保 数据 库 中 的 数据 一 致 性 。 例 如 ,如 果 在 医生 表 中 输入 了 医生 
号 为 123 的 医生 ,那么 该 数据 库 不 应 允许 其 他 医生 使 用 同一 医生 号 。 如 果 计 划 将 医生 的 
年 龄 列 的 值 范围 设 定 为 1 一 150, 则 数据 库 不 应 接受 160。 如 果 医 生 表 中 有 部 门 号 ,该 列 存 
储 医生 所 在 的 部 门 编号 , 则 数据 库 应 只 允许 接受 医院 中 的 有 效 部 门 编号 。 

数据 完整 性 有 3 种 类 型 : 实体 完整 性 (Entity Integrity)、 引 用 完整 性 (Referential 
Integrity) 、 用 户 定 义 完整 性 (User-Defined Integrity) 。 
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实体 完整 性 指 实体 的 所 有 主 属性 均 不 可 取 空 值 。 由 于 一 个 实体 映射 到 表 中 的 一 行 ， 
表 的 主键 约束 (PRIMARY KEY) 保 证 了 实体 完整 性 。 每 个 表 只 能 有 一 个 主键 约束 ;用 于 
主键 约束 的 列 的 取 值 是 不 重复 的 (对 由 多 列 组 成 的 主键 ,其 各 列 取 值 组 合 不 同 ) ,而 且 不 允 
许 有 空 值 (对 由 多 列 组 成 的 主键 ,每 个 列 均 不 允许 有 空 值 ) 。 

对 于 东山 县 医院 业务 库 中 的 医生 表 ,“ 医 生 号 ”是 主键 ,假设 医生 表 中 还 没有 医生 号 为 
501 的 医生 (如 果 有 ,就 先 将 其 删除 ) ,执行 下 列 操作 。 

在 医生 表 中 插入 如 下 语句 : 


INSERT INTO 医生 VALUES('501', 张力 '，'5') 
再 次 插入: 
INSERT INTO 医生 VALUES('501',' 王 丹 ',，'5') 


SQL Server 会 出 现 错误 信息 ,拒绝 插入 行 。 这 是 因为 主键 约束 不 允许 键 值 重复 。 
再 次 插入 : 


INSERT INTO 医生 姓名 , 部 门 号 ) vAIDES(' 王 丹 ','5') 


SQL Server 会 出 现 错 误 信 息 ,拒绝 插入 行 。 这 是 因为 主键 约束 不 允许 键 值 为 空 。 

引用 完整 性 也 称 为 参照 完整 性 。 在 输入 或 删除 行 时 ,引用 完整 性 维护 表 之 间 已 定义 
的 关系 。 引 用 完整 性 通常 通过 外 键 (FOREIGN KEY) 与 主键 之 间 参 照 实现 。 引 用 完整 
性 保证 键 值 在 所 有 表 中 是 一 致 的 。 这 样 的 一 致 性 要 求 不 能 引用 不 存在 的 键 值 。 外 键 表 的 
任意 一 个 外 键 值 必须 等 于 主键 表 中 所 引用 的 主键 的 某 个 值 或 者 为 空 。 

例如 ,假设 医生 表 中 还 没有 定义 对 部 门 表 中 “部 门 号 ”的 引用 。 假 设 部 门 表 中 没有 6 
号 部 门 。 然 后 在 医生 表 中 插入 : 

INSERT INIO 医 生 VaruEs('601'，' 潘 辉 60) 

由 于 医生 表 和 部 门 表 之 间 不 存在 外 键 约束 ,因此 该 行 被 成 功 插入 医生 表 中 。 但 事实 
上 造成 了 数据 不 一 致 : 某 个 医生 在 6 号 部 门 .而 6 号 部 门 不 存在 。 在 医生 表 上 建立 外 键 
约束 可 以 避免 这 种 “ 脏 ” 数 据 。 

假设 医生 表 中 定义 了 对 部 门 表 中 “部 门 号 "的 引用 ,而 且 医 生 表 中 存在 一 行 正在 引用 
5 号 部 门 (501', 张力 ,5)7。 此 时 把 部 门 表 中 5 号 部 门 “信息 中 心 ” 的 部 门 号 改 为 8: 

UPDATE 部 门 

SET 部 门 号 = '8' 

WHERE 部 门 号 ='5' 

SQL Server 会 出 现 错误 信息 ,拒绝 更 新 行 。 如 果 在 医生 表 中 的 外 键 列 “部 门 号 "上 设 
置 了 级 联 更 新 ,再 次 执行 , 则 会 看 到 不 仅 在 部 门 表 中 5 号 部 门 的 部 门 号 改 为 8, 而 且 医 生 
表 中 所 有 部 门 号 为 5 的 行 都 改 为 8 了 。 

用 户 定义 完整 性 称 为 域 完整 性 或 语义 完整 性 .包括 检查 约束 、 默 认 值 定义 、NOT 
NULL 和 唯一 约束 等 。 
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假设 用 户 正在 使 用 SQL Server 管理 的 数据 库 A, 那么 把 数据 库 A 中 的 若干 表 复 制 
到 SQL Server 数据 库 B 中 ,或 者 把 数据 库 A 中 的 若干 表 复制 到 其 他 数据 库 管理 系统 中 
称 为 从 SQL Server 数据 库 中 导出 数据 ; 反 过 来 ,把 其 他 数据 库 管理 系统 中 的 表 复 制 到 数 
据 库 A 中 ,或 者 把 数据 库 B 中 的 表 复 制 到 数据 库 A 中 , 称 为 导 和 人 数据 到 SQL Server 中 。 
因为 对 数据 库 的 所 有 操作 都 涉及 权限 控制 ,所 以 首先 介绍 一 下 数据 库 的 安全 管理 。 


3.1 用 户 以 及 授权 


3.1.1 SQL Server 的 安全 体系 结构 


SQL Server 2008 为 数据 库 和 应 用 程序 设置 了 4 道 安全 防线 : 操作 系统 的 安全 防线 、 
SQL Server 的 运行 安全 防线 ,SQL Server 数据 库 的 安全 防线 和 SQL Server 数据 库 对 象 
的 安全 防线 。 用 户 要 想 获得 SQL Server 2008 数据 库 及 其 对 象 ,必须 通过 这 4 道 安 全 防 
线 。4 道 安全 防线 如 图 3-1 所 示 。 


Windows 


图 3-1 4 道 安全 防线 


1) 操作 系统 的 安全 防线 

Windows(Windows 2013 Server 等 ) 网 络 管理 员 负 责 建立 用 户 组 ,设置 账号 并 注册 ， 
同时 决定 不 同 的 用 户 对 不 同系 统 资源 的 访问 级 别 。 用 户 只 有 拥有 了 一 个 有 效 的 
Windows 登录 账号 ,才能 对 网 络 系统 资源 进行 访问 。 

2) SQL Server 的 运行 安全 防线 

SQL Server 通过 登录 账号 设置 创建 附加 安全 层 。 用 户 只 有 登录 成 功 ,才能 与 SQL 
Server 建立 一 次 连接 。 
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3) SQL Server 数据 库 的 安全 防线 

SQL Server 的 特定 数据 库 都 有 自己 的 用 户 和 角色 ,该 数据 库 只 能 由 它 的 用 户 或 角色 
访问 ,其 他 用 户 无 权 访问 其 数据 。 数 据 库 系统 可 以 通过 创建 和 管理 特定 数据 库 的 用 户 和 
角色 保证 数据 库 不 被 非法 用 户 访问 。 

4) SQL Server 数据 库 对 象 的 安全 防线 

SQL Server 可 以 对 权限 进行 管理 。SQL Server 完全 支持 SQL 标准 的 DCL 功能 ， 
T-SQL 的 DCL 功能 保证 合法 用 户 即 使 进入 了 数据 库 , 也 不 能 有 超越 权限 的 数据 存 取 操 
作 , 即 合法 用 户 必须 在 自己 的 权限 范围 内 进行 数据 操作 。 


3.1.2 安全 认证 模式 


安全 认证 是 指数 据 库 系统 对 用 户 访 问 数据 库 系统 时 所 输入 的 账号 和 口令 进行 确认 的 
过 程 。 安 全 认证 的 内 容 包 括 确认 用 户 的 账号 是 否 有 效 .能 否 访问 系统 、 能 访问 系统 中 的 哪 
些 数据 等 。 

安全 认证 模式 是 指 系统 确认 用 户 身 份 的 方式 。SQL Server 2008 有 两 种 安全 认证 模 
式 , 即 Windows 安全 认证 模式 和 混合 验证 模式 。 

Windows 安全 认证 模式 是 指 SQL Server 服务 器 通过 使 用 Windows 网 络 用 户 的 安 
全 性 控制 用 户 对 SQL Server 服务 器 的 登录 访问 。 它 允许 一 个 网 络 用 户 登录 到 一 个 SQL 
Server 服务 器 上 时 不 必 再 提供 一 个 单独 的 登录 账号 及 口令 ,从 而 实现 SQL Server 服务 器 
与 Windows 登录 的 安全 集成 。 

混合 验证 模式 下 ,用户 可 以 使 用 Windows 身份 验证 ,也 可 以 使 用 SQL Server 标准 账 
户 登 录 。SQL Server 登录 账号 是 独立 于 操作 系统 登录 账号 的 ,从 而 可 以 在 一 定 程度 上 避 
免 操作 系统 层 上 对 数据 库 的 非法 访问 。 

无 论 哪 种 身份 验证 方式 ,采用 Windows 身份 验证 连接 SQL Server 总 是 可 以 的 (只 要 
该 Windows 用 户 是 SQL Server 的 登录 号 )。 

使 用 SQL Server 2008 管理 器 设置 安全 认证 模式 的 步骤 如 下 : 右 击 SQL Server 服务 
器 的 名 称 ,选择 * 属 性”, 再 选择 “安全 性 ?选项 卡 ;在 “服务 器 身份 验证 ”下 根据 需要 选择 
“SQL Server 和 Windows 身份 验证 模式 ?或 者 "Windows 身份 验证 模式 ”。 最 后 重新 启动 
SQL Server 服务 。 


3.1.3 用 户 管理 
SQL Server 的 用 户 分 为 服务 器 用 户 和 数据 库 用 户 。 
1. 服务 器 用 户 管理 


1) 登录 账号 

登录 账号 也 称 为 登录 用 户 或 登录 名 ,是 服务 器 级 用 户 访问 数据 库 系 统 的 标识 。 为 了 
访问 SQL Server 系统 ,用 户 必须 提供 正确 的 登录 账号 ,这 些 登录 账号 既 可 以 是 Windows 
登录 账号 ,也 可 以 是 SQL Server 登录 账号 。 登 录 账 号 的 信息 是 系统 信息 ,存储 在 master 
数据 库 的 sysxlogins 系统 表 中 ,用 户 如 需要 有 关 登 录 账 号 的 信息 ,可 以 到 该 表 中 查询 。 


EE 


SQL Server 2008 的 登录 账号 sa(System Administrator) 在 SQL Server 系统 中 拥有 
全 部 权限 ,可 以 执行 所 有 操作 ;登录 账号 “机 器 名 \administrator” 也 拥有 全 部 权限 。 

SQL Server 2008 有 3 种 类 型 的 登录 账户 : Windows 组 、Windows 用 户 、 标 准 。 
Windows 组 和 Windows 用 户 是 指 SQL Server 允许 Windows 的 某 个 用 户 或 某 个 组 中 的 
所 有 用 户 登 录 SQL Server。 标 准 账户 是 SQL Server 自己 的 账户 ,使 用 自己 的 账户 登录 
需要 SQL Server 身份 验证 方式 运行 在 “SQL Server 和 Windows 身份 验证 模式 ”。 

2) 查看 登录 账号 

使 用 管理 器 可 以 创建 查看 和 管理 登录 账号 。“ 登 录 账 号 "存放 在 SQL 服务 器 的 安全 
性 文件 夹 中 。 当 进入 管理 器 ,打开 指定 的 SQL 服务 器 ,并 选择 “安全 性 ”文件 夹 时 , 单 击 
“登录 名 ”可 以 看 到 当前 数据 库 服 务 器 的 合法 登录 用 户 的 一 些 信 息 。 

3) 创建 登录 账号 

创建 一 个 登录 账号 的 操作 步骤 为 : 右 击 “登录 名 ”文件 夹 ,在 弹出 的 菜单 中 选择 “新 建 
登录 名 ”选项 后 ,会 出 现 “ 新 建 登录 ”对 话 框 界面 ,在 其 中 填写 相应 信息 即 可 。 也 可 以 通过 
此 界面 设 定 该 登录 用 户 的 服务 器 角色 和 要 访问 的 数据 库 ,这 样 该 登录 账号 同时 也 作为 数 
据 库 用 户 。 

例如 ,通过 管理 器 建立 标准 登录 账户 “高 林 ?” 的 操作 步骤 如 下 : 第 一 步 ,展开 “安全 性 ” 
结 点 , 右 击 “ 登 录 名 ”; 第 二 步 , 从 弹出 的 菜单 中 选择 “新建 登 录 名 ”; 第 三 步 : 在 “登录 名 ” 文 
本 框 中 输入 “高 林 ”; 第 四 步 , 单 击 *SQL Server 身份 验证 ”, 输 入 密码 ;第 五 步 , 单 击 “ 确 定 ” 
按钮 。 

通过 管理 器 建立 Windows 组 或 Windows 用 户 类 型 的 登录 账户 jack4 的 操作 步骤 如 
下 : 布 击 登录 名 ,从 弹出 的 快捷 菜单 中 单 击 “ 新 建 登录 名 ”, 出 现 “ 登 录 名 -新 建 ” 对 话 框 。 
单 击 “ 登 录 名 ”文本 框 后 的 “搜索 ”按钮 ,弹出 “选择 用 户 或 组 ”对 话 框 , 单 击 “ 高 级 "按钮 ,再 
单 击 “ 立 即 查 找 ” 按 钮 。 在 对 话 框 的 下 面 会 出 现 用 户 名 ,选择 用 户 名 后 单 击 “ 确 定 ” 按 钮 , 关 
闭 对 话 框 , 回 到 “登录 名 -新 建 "页 面 ,名 称 项 后 面 的 文本 框 中 出 现 所 选择 的 Windows 组 或 
Windows 用 户 , 单 击 “ 确 定 ” 按 钮 即 可 。 

4) 编辑 或 删除 登录 账号 

单 击 “ 登 录 名 ”文件 夹 , 在 出 现 的 显示 登录 账号 的 窗口 中 右 击 需要 操作 的 登录 号 : 选 
择 “ 属 性 ” 便 可 对 该 账号 已 设 定 内 容 进 行 重新 编辑 (如 修改 密码 ) ;选择 “删除 ” 便 可 删除 该 
登录 账号 。 注 意 ,删除 前 要 断 开 该 账号 与 服务 器 建立 的 活动 连接 。 

可 以 把 具有 相同 权限 的 某 些 用 户 设 置 成 某 一 角色 .这些 用 户 称 为 该 角色 的 成 员 。 当 
对 该 角色 进行 权限 设置 时 ,其 成 员 自动 继承 该 角色 的 权限 。 这 样 , 只 要 对 角色 进行 权限 管 
理 , 就 可 以 实现 对 属于 该 角色 的 所 有 成 员 的 权限 管理 ,大 大 减少 了 工作 量 。 

SQL Server 中 有 两 种 角色 , 即 服务 器 角色 和 数据 库 角 色 。 系 统管 理 员 (sysadmin) 就 
是 一 种 服务 器 角色 。 

使 用 管理 器 将 登录 账号 添加 到 某 一 指定 的 服务 器 角色 作为 其 成 员 的 步骤 如 下 : 登录 
服务 器 后 ,展开 “安全 性 ”文件 夹 , 单 击 “ 服 务 器 角色 ?文件 夹 , 右 击 某 一 角色 ,从 弹出 的 菜单 
中 选择 “属性 ”命令 ,可 以 添加 某 些 登 录 账 号 作为 该 角色 的 成 员 , 也 可 以 将 某 一 登录 账号 从 
该 角色 的 成 员 中 删除 。 


二 动 分 和 醒 : 风 的 国 到 因 灼 旺 


2 数据 库 用 户 管理 


1) 数据 库 用 户 

数据 库 级 用 户 是 某 个 数据 库 的 访问 标识 。 数 据 库 用 户 必 须 具 有 登录 账号 。 登 录用 户 
只 有 成 为 数据 库 用 户 ( 或 数据 库 角 色 ) 后 才能 访问 数据 库 。 用 户 与 具体 的 数据 库 有 关 。 例 
如 多 东 山 县 医院 业务 库 ? 数 据 库 中 的 用 户 账号 "高 林 " 不 同 于 “东山 县 医院 财务 库 ? 数 据 库 
中 的 用 户 账号 “高 林 ”。 

每 个 数据 库 的 用 户 信息 都 存放 在 系统 表 sysusers 中 ,通过 查看 该 表 可 以 看 到 当前 数 
据 库 所 有 用 户 的 情况 。 在 该 表 中 ,每 一 行 数据 表示 一 个 SQL Server 用 户 或 SQL Server 
角色 信息 。 创 建 数据 库 的 用 户 称 为 数据 库 所 有 者 (dbo) ,他 具有 这 个 数据 库 的 所 有 权限 。 
创建 数据 库 对 象 的 用 户 称 为 数据 库 对 象 的 所 有 者 ,他 具有 该 对 象 的 所 有 权限 。 在 每 一 个 
SQL Server 2008 数据 库 中 ,至 少 有 一 个 名 称 为 dbo 的 用 户 。 系 统管 理 员 sa 是 他 所 管理 
系统 的 任何 数据 库 的 dbo 用 户 。 

2) 查看 数据 库 用 户 

使 用 管理 器 可 以 创建 .查看 和 管理 数据 库 用 户 。 每 个 数据 库 中 都 有 * 用 户 " 文 件 夹 。 
当 进 入 管理 器 ,打开 指定 的 SQL 服务 器 ,并 打开 “数据 库 ” 文 件 夹 , 选 定 并 打开 要 操作 的 数 
据 库 后 ,展开 * 安 全 性 ”, 再 单 击 * 用 户 " 文 件 夹 就 会 出 现 用 户 信息 窗口 。 通 过 该 窗口 可 以 看 
到 当前 数据 库 合 法 用 户 的 一 些 信息 。 

3) 创建 新 的 数据 库 用 户 

展开 数据 库 结 点 , 右 击 “ 用 户 ” 文 件 夹 , 在 弹出 的 菜单 中 选择 “新 建 用 户 ” 命 令 后 ,会 出 
现 新 建 用 户 对 话 框 界面 ,在 “登录 名 ”下 拉 列 表 框 中 选择 预 创建 用 户 对 应 的 登录 名 ( 即 登录 
账号 ) ,然后 在 “用 户 名 ”的 文本 框 中 输入 用 户 名 。 

4) 编辑 或 删除 数据 库 用 户 账 号 

单 击 “ 用 户 ” 文 件 夹 ,在 出 现 的 显示 用 户 账号 的 窗口 中 右 击 需 要 操作 的 用 户 账号 ,选择 
“属性 ”命令 ,出 现 该 用 户 的 角色 和 权限 窗口 ,可 对 该 用 户 已 设 定 内 容 进 行 重新 编辑 ;选择 
“删除 ? 便 可 删除 该 数据 库 用 户 。 

进行 上 述 操作 需要 对 当前 数据 库 拥有 用 户 管理 (db_accessadmin) 及 其 以 上 的 权限 。 

将 数据 库 用 户 添加 到 某 一 数据 库 角 色 的 步骤 为 : 打开 指定 的 数据 库 , 单 击 * 角 色 ” 文 
件 夹 , 右 击 某 个 固定 数据 库 角色 ,在 出 现 的 菜单 中 选择 “属性 ”命令 , 单 击 “ 添 加 ”按钮 , 则 会 
出 现 该 角色 的 非 成 员 用 户 , 按 提示 信息 操作 可 以 将 他 们 添加 到 该 角色 中 ;选中 某 一 用 户 
后 , 单 击 “删除 ?按钮 可 以 将 此 用 户 从 该 角色 中 删除 。 

在 许多 情况 下 ,需要 用 户 自 定义 数据 库 新 角色 。 

使 用 管理 器 创建 数据 库 角 色 的 步骤 为 : 在 管理 器 中 打开 要 操作 的 数据 库 文件 夹 , 右 
击 “ 角 色 ” 文 件 夹 , 并 在 弹出 的 菜单 中 选择 “新 建 数 据 库 角色 ”命令 , 则 出 现 “ 新 建 数据 库 角 
色 ” 对 话 框 , 按 提示 填写 角色 名 称 等 相应 信息 后 , 单 击 “ 确 定 ” 按 钮 即 可 。 

需要 在 “新 建 数据 库 角 色 ” 对 话 框 的 名 称 栏 中 输入 新 角色 名 ;在 成 员 栏 中 添加 或 删除 
角色 中 的 用 户 。 
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3 管理 用 户 权 限 


可 在 管理 器 中 授予 数据 库 用 户 在 数据 库 对 象 上 的 权限 (如 查询 修改、 插入、 删除 等 )。 
例如 ,授予 数据 库 用 户 “高 林 ” 查 询 医 生 表 的 权限 的 步骤 如 下 : 第 一 步 , 单 击 “东山 县 医院 
业务 库 ” 的 “用 户 ” 项 ;第 二 步 ,在 右边 用 户 列 表 中 右 击 “高 林 ”, 在 弹出 的 菜单 中 选择 “ 属 
性 ”, 单 击 “ 安 全 对 象 "页 , 单 击 “ 搜 索 ”“ 确 定 ” 按 钮 ,再 单 击 “ 对 象 类 型 ”, 出 现 “ 选 择 对 象 类 
型 ”对话 框 , 选 择 表 ; 第 三 步 , 单 击 “ 浏 览 ” 按 钮 ,出 现 “ 查 找 对 象 " 对 话 框 ,选择 表 “ 医 生 ”; 第 
四 步 ,返回 “安全 对 象 " 页 , 色 选 医生 表 上 的 “选择 ”权限 ;第 五 步 , 单 击 “ 确 定 ” 按 钮 。 

在 对 话 框 的 权限 列表 中 ,可 以 对 每 个 对 象 进行 授予 撤销 或 禁止 权限 操作 。 在 权限 表 
中 ,权限 SELECT( 查 询 ) .INSERT( 插 入 )\UPDATE( 更 新 ) 等 安排 在 列 中 ,每 个 对 象 的 
操作 权 用 一 行 表示 。 在 相应 的 复 选 框 上 ,如 果 为 “VY”, 则 为 授权 ;如 果 为 *X”, 则 为 禁止 权 
限 ;如 果 为 空白 , 则 为 撤销 权限 。 单 击 复 选 框 可 改变 其 状态 。 

如 果 在 管理 器 中 登录 SQL Server 采用 “Windows 身份 验证 ”, 这 样 默认 的 Windows 
用 户 是 Administrator, 该 用 户 在 任何 数据 库 中 都 具有 dbo( 数 据 库 所 有 者 ) 角 色 , 所 以 具有 
管理 数据 库 其 他 用 户 的 权限 。 

权限 两 个 字 , 一 个 权力 ,一 个 限制 。 就 是 哪些 人 可 以 对 哪些 资源 做 哪些 操作 。 在 
SQL Server 中 ,哪些 人 “哪些 资源 “哪些 操作 ”分 别 对 应 SQL Server 中 的 3 个 术语 : 主 
体 (Principals, 如 高 林 ) ,安全 对 象 (Securables, 如 表 ) 和 权限 (Permissions, 如 SELECT)， 
而 权力 和 限制 则 对 应 了 SQL Server 中 的 GRENT 和 DENY。 

“主体 ”是 可 以 请 求 SQL Server 资源 的 实体 。 主 体 可 以 是 个 体 、 组 或 者 进程 。 主 体 
可 以 按照 作用 范围 被 分 为 三 类 : Windows 级 别 主体 、 服 务 器 级 别 主体 和 数据 库 级 别 主体 。 

Windows 级 别 的 主体 包括 Windows 域 登录 名 和 Windows 本 地 登录 名 。 

SQL Server 级 的 主体 包括 SQL Server 登录 名 和 服务 器 角色 。 

数据 库 级 的 主体 包括 数据 库 用 户 和 数据 库 角色 以 及 应 用 程序 角色 。 

登录 名 是 服务 器 级 别 的 主体 ,但 无 论 是 上 述 哪 个 层级 的 主体 ,因为 需要 登录 到 SQL 
Server 实例 ,所 以 每 一 个 层级 的 主体 都 需要 一 个 与 之 对 应 的 登录 名 。 对 于 Windows 级 别 
的 主体 来 说 , Windows 用 户 会 映射 到 登录 名 。 对 于 数据 库 级 别 的 主体 来 说 ,其 用 户 必 须 
映射 到 登录 名 中 ,而 登录 名 可 以 不 映射 到 数据 库 用 户 。 

数据 库 用 户 是 数据 库 级 别 的 主体 ,被 用 于 访问 数据 库 层面 的 对 象 。 默 认 情 况 下 ,每 个 
数据 库 都 有 4 个 内 置 用户 : dbo、guest、INFORMATION_SCHEMA 和 sys。 

dbo 用 户 是 Database Owner 的 简称 ,如 果 说 SA 是 实例 级 别 的 统治 者 , 那 dbo 就 是 数 
据 库 级 别 的 统治 者 。 这 个 用 户 不 能 被 删除 ,每 一 个 属于 sysadmin 的 服务 器 角色 都 会 映射 
到 数据 库 的 dbo 用 户 。 

guest 用 户 是 一 个 来 宾 账 户 ,这 个 账户 允许 登录 名 没有 映射 到 数据 库 用 户 的 情况 下 
访问 数据 库 。 默 认 情 况 下 ,guest 用 户 是 不 启用 的 ,可 以 通过 如 下 代码 启用 或 不 启用 
guest 用 户 。 


-- 人 允许 guest 用 户 连接 权限 


GRANT CONNECT TO guest 


二 动 分 和 醒 : 内 的 国 到 央 灼 旺 


- -收回 guest 用 户 的 连接 权限 
REVOKE OONNECT FROM guest 


角色 便于 对 主体 进行 管理 。 属 于 某 个 角色 的 用 户 或 登录 名 拥有 相同 的 权限 。 当 具有 
相同 职责 的 数据 库 用 户 很 多 时 ,一 般 首先 为 这 些 用 户 定义 一 个 共同 的 “角色 ”, 然 后 为 这 个 
角色 授予 权限 ,最 后 再 去 创建 数据 库 用 户 并 将 这 个 角色 与 之 关联 起 来 。 

public 角色 是 一 种 内 置 角色 ,其 权限 可 以 被 调整 。 可 以 将 public 角色 理解 为 访问 数 
据 库 或 实例 的 最 小 权限 。public 拥有 的 权限 自动 被 任何 主体 继承 。 用 户 自 定义 角色 是 按 
照 用 户 自己 的 需求 组 成 的 角色 ,由 用 户 创建 。 

架构 (Schema) 是 一 个 命名 空间 ,该 空间 拥有 一 些 数 据 库 层级 的 对 象 。 默 认 架 构 是 
dbo 时 ,如 果 被 访问 的 对 象 的 架构 也 是 dbo, 可 以 在 被 访问 的 对 象 前 省 略 架 构 名 称 : 


SELECT * FROM Custamer 
否则 ,必须 有 架构 名 称 : 


SEIECT # FROM dbo.Custcmer 


3.1.4 数据 控制 语句 


用 户 权 限 主要 包括 数据 对 象 和 操作 类 型 两 个 要 素 。 定 义 用 户 的 存 取 权 限 称 为 授权 
(GRANT) ,通过 授权 规定 用 户 可 以 对 哪些 数据 进行 什么 样 的 操作 。 表 3-1 列 出 了 不 同类 
型 的 数据 对 象 的 操作 权限 。 


表 3-1 不 同类 型 的 数据 对 象 的 操作 权限 


类 别 操作 权限 
表 , 视 图 SELECT.\INSERT .UPDATE.DELETE 
数据 对 象 
表 、 视 图 中 的 列 SELECT、.UPDATE 
语 句 CREATE DATABASE.CREATE TABLE.CREATE VIEW 
授权 GRANT 的 语法 : 


GRANT < 权限 D> [< 权限 2> ,…] [CN < 对 象 名 称 >] TO < 用 户 > [,< 用 户 2> ,…] 


其 功能 是 将 指定 数据 对 象 的 指定 权限 授予 指定 的 用 户 。 下 面 通 过 例子 理解 GRANT 
语句 的 数据 控制 功能 。 假 设 已 经 存在 用 户 “高 林 ”, 那 么 把 对 部 门 表 中 的 “名 称 ” 列 的 修改 
权限 以 及 部 门 表 的 查询 权限 授 巴 用户“ 高林 ”的 语句 如 下 。 


GRANT UPDATE (名称), sgIEcT CN 部门 J; 高林 
把 在 数据 库 中 建立 表 的 权限 授予 用 户 “ 高 林 ” 的 语句 如 下 。 
GRANT CREATE TABIE To 高 林 


回收 (REVOKE) 权 限 的 语法 : 
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REVCKE < 权限 1> [,< 权 限 2>…] [Qk 对 象 名 >] 

FROM < 用 户 1> [,< 用 户 妆 …] 

其 功能 是 把 已 经 授予 指定 用 户 的 指定 权限 收回 。 例 如 ,把 用 户 “高 林 ” 修 改 部 门 名 称 
的 权限 收回 的 语句 如 下 。 


REVOKE UPDATE (名 称 ) ON 部门 FROM 高 林 


3.2 从 SQL Server 数据 库 导入 表 


3.2.1 利用 数据 库 的 分 离 /附加 功能 实现 数据 导 人 


“分 离 ”" 和 “附加 ”是 互 逆 的 两 个 操作 。“ 分 离 数据 库 ” 是 断 开 数 据 库 与 SQL Server 的 
被 管理 与 管理 关系 ,但 并 不 在 磁盘 上 删除 组 成 数据 库 的 数据 文件 和 日 志文 件 。 使 用 分 离 / 
附加 功能 实现 数据 采集 主要 有 3 个 步骤 : 从 被 审 单位 数据 库 服务 器 上 分 离 所 需 的 数据 
库 ; 审 计 人 员 将 该 数据 库 的 数据 文件 和 日 志文 件 复制 到 自己 的 移动 存储 介质 上 ;将 数据 库 
附加 到 自己 本 地 计算 机 的 SQL Server 数据 库 服务 器 上 。 

在 分 离 数据 库 之 前 ,应 该 先 查看 要 分 离 的 数据 库 包含 的 全 部 数据 文件 和 日 志文 件 ,以 
及 这 些 文件 的 存放 位 置 和 文件 名 ,以 便于 分 离 后 对 这 些 文件 进行 复制 。 查 看 数据 库 包含 
的 全 部 数据 文件 和 日 志文 件 可 以 在 管理 器 中 实现 ,也 可 以 利用 系统 存储 过 程 实现 。 

在 管理 器 中 右 击 待 分 离 的 数据 库 , 从 弹出 的 菜单 中 选择 [任务 〗I【 分 离 】, 如 果 还 有 其 
他 连接 (例如 ,在 SQL 编辑 器 中 正在 使 用 该 数据 库 )' 则 在 “分离 数据 库 ” 对 话 框 中 设置 “ 删 
除 连 接 ”, 之 后 单 击 “ 确 定 ” 按 钮 即 可 实现 分 离 。 

分 离 结束 后 ,将 涉及 的 数据 文件 和 日 志文 件 复制 到 自己 的 移动 硬盘 或 自己 的 计算 机 
中 ,然后 利用 附加 功能 把 数据 库 附加 上 。 数 据 库 附 加 步骤 如 下 。 

在 对 象 资 源 管 理 器 中 右 击 数据库”, 从 弹出 的 菜单 中 选择 “附加 ”。 在 “附加 数据 库 ” 
对 话 框 中 需要 指定 数据 库 主 文件 的 文件 名 , 单 击 “ 添 加 ”按钮 ,在 出 现 的 对 话 框 中 选择 数据 
库 主 文件 的 文件 名 , 单 击 “ 确 定 ” 按 钮 。 

回 到 附加 数据 库 页 面 ,数据 库 文件 和 日 志文 件 自动 列 出 来 ,在 “附加 为 "下 面 设置 数据 
库 逻 辑 名 ,可 以 和 原来 的 名 称 不 一 样 。 由 于 数据 文件 和 日 志文 件 在 源 服务 器 上 的 路 径 一 
般 不 同 于 所 要 附加 的 服务 器 的 路 径 , 所 以 通常 需要 修改 “mdf 文件 位 置 ”, 最 后 单 击 “ 确 定 ” 
按钮 即 可 。 


3.2.2 直接 复制 数据 库 中 的 文件 


先 将 被 审 单位 的 SQL Server 服务 停止 ,然后 将 所 需 的 数据 文件 和 日 志文 件 复制 到 自 
己 的 移动 硬盘 或 自己 的 计算 机 中 ,再 将 被 审 单位 的 SQL Server 服务 启动 起 来 。 在 自己 的 
计算 机 上 ,利用 附加 功能 可 以 将 数据 库 添加 进来 。 


3.2.3 备份 /还 原 
使 用 备份 /还 原 的 办 法 采集 数据 主要 有 3 个 步骤 : 在 被 审 单位 数据 库 服务 器 上 完整 
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备份 所 需 的 数据 库 ; 把 备份 文件 复制 到 移动 介质 上 ;把 备份 文件 复制 到 审计 人 员 本 地 计算 
机 的 硬盘 上 ,并 恢复 到 本 地 数据 库 服务 器 中 。 

备份 的 步骤 如 下 : 在 SQL Server 管理 器 里 选中 要 转移 的 数据 库 , 按 鼠标 右键 ,选择 
【任务 了 民 备 份 ]。 在 “备份 数据 库 ? 对 话 框 中 ,保持 其 他 选项 不 变 , 在 “目标 项 中 单 击 “ 添 
加 ”; 在 弹出 的 菜单 中 选择 按 文 件 保存 备份 ,在 “文件 名 ”后 输入 要 保存 到 的 路 径 和 文件 名 。 
文件 名 的 扩展 名 约定 为 . bak。 单 击 “ 确 定 ” 按 钮 ,关闭 “选择 备份 目标 ”对 话 框 , 回 到 “ 备 
份 " 对 话 框 ,再 次 单 击 “ 确 定 ” 按 钮 ,开始 备份 进程 。 

备份 文件 可 以 随便 迁移 到 任何 地 方 ,包括 另外 的 SQL Server 服务 器 。 

在 本 地 计算 机 上 启动 管理 器 ,下 面 的 步骤 把 备份 文件 恢复 到 一 个 新 数据 库 “test” 中 : 
右 击 数据 库 文件 夹 ,选择 “ 还 原 数据 库 ”; 在 “还 原 数据 库 ” 对 话 框 中 输入 “目标 数据 库 ” 的 数 
据 库 名 字 “test”, 单 击 “ 源 设备 ”; 单 击 “ 源 设备 ” 右 侧 的 按钮 , 单 击 “ 添 加 ”按钮 ;找到 要 导入 
的 备份 数据 库 文件 名 , 单 击 “ 确 定 ” 按 钮 ; 单 击 “ 确 定 ” 按 钮 关闭 “指定 备份 "对话 框 。 

单 击 “ 还 原 数 据 库 ” 中 的 “选项 ”选择 页 ,保持 数据 文件 和 日 志文 件 的 逻辑 名 不 变 。 由 
于 备份 文件 中 记载 的 是 被 审 单位 的 数据 文件 路 径 , 所 以 “还 原 为 栏 中 显示 了 被 审 单位 的 
数据 文件 全 路 径 名 。 该 路 径 一 般 与 审计 人 员 本 地 计算 机 路 径 不 同 ,所 以 通常 在 还原 为 ” 
列 中 修改 数据 文件 和 日 志文 件 的 物理 文件 名 为 本 地 路 径 名 , 单 击 “ 确 定 ” 按 钮 ,完整 的 数据 
库 导 入 就 成 功 了 。 

如 果 还 原 到 本 地 服务 器 中 已 经 存在 的 数据 库 上 , 则 需要 勾 选 “ 莉 盖 现 有 数据 库 ”。 


3.2.4 导 人 导出 


假设 能 够 将 审计 人 员 的 笔记 本 连 人 被 审 单位 的 计算 机 网 络 ,并 能 够 访问 所 需 的 数据 
库 。 下 面 的 步 又 演示 了 如 何 从 被 审 单位 数据 库 中 把 所 需 的 表 导 和 人 本 地 数据 库 中 。 

首先 ,在 本 地 计算 机 的 SQL Server 中 创建 一 个 空 的 数据 库 , 如 名 字 为 “我 的 数据 库 ”， 
准备 接收 表 对 象 。 

然后 ,将 本 地 计算 机 连 入 网 络 ,设置 适当 权限 ,使 其 能 够 访问 数据 源 所 在 的 SQL 
Server 服务 器 。 假 如 该 服务 器 的 名 字 为 1x080。 

在 管理 器 中 右 击 “我 的 数据 库 ”, 选 择 【任务 3】I【 导 入 数据 …】 出现“SQL Server 导入 
和 导出 向 导 ”。 在 “选择 数据 源 ” 对 话 框 中 设置 服务 器 为 lx080, 数 据 库 为 东山 县 医院 财务 
库 ; 在 “选择 目标 ”对 话 框 中 设置 服务 器 为 local, 数 据 库 为 “我 的 数据 库 ”; 在 “指定 表 复 制 
或 查询 ”对话 框 中 选择 “复制 一 个 或 多 个 表 或 视图 的 数据 ?。 在 “选择 源 表 或 源 视图 对话 
框 中 单 击 “ 源 ”前 面 的 方 框 ,选择 所 有 表 和 视图 。 单 击 “ 下 一 步 " 按 钮 ,选择 “立即 运行 ”。 


3.3 从 其 他 数据 库 导 入 表 


在 审计 实践 中 ,经 常 需要 将 各 种 来 源 的 数据 (如 Access 数据 库 或 ASCII 文本 文件 ) 移 
植 到 SQL Server 2008 数据 库 中 。 这 种 把 不 同 来 源 的 数据 迁移 到 SQL Server 2008 数据 
库 中 的 过 程 就 是 数据 导入 。 


EE 


3.3.1 把 Access 数据 导 人 SQL Server 


假设 已 经 从 被 审 单位 获取 一 个 Access 数据 库 : C: \data\ 东 山 县 医院 财务 数据 . mdb。 
把 它 通过 SQL Server 导入 导出 向 导 导入 SQL Server 中 有 两 个 途径 : Access 驱动 途径 和 
ODBC 驱动 途径 。 

如 果 存在 可 供 SQL Server 导入 导出 向 导 直 接 使 用 的 驱动 , 则 可 以 不 使 用 ODBC 这 
一 层 驱 动 软件 ,而 直接 使 用 源 数据 库 的 驱动 软件 。 

首先 看 Access 驱动 途径 的 导入 。 

假设 在 SQL Server 中 已 经 存在 一 个 准备 接收 Access 数据 库 中 表 的 空 数据 库 “ 我 的 
数据 库 ”( 如 果 没 有 , 则 新 建 一 个 空 数据 库 )。 直 接 使 用 Access 驱动 途径 的 步骤 如 下 : 
@ 在 SQL Server 管理 器 中 的 “我 的 数据 库 ” 上 右 击 ,选择 “任务 ”, 继 续 选 择 导 人 数据 ”， 
出 现 SQL Server 数据 导入 导出 向 导 。@ 在 “选择 数据 源 ” 对 话 框 中 选择 Microsoft 
Access, 然 后 键 和 人 东山 县 医院 财务 数据 . mdb 数据 库 (. mdb 为 文件 扩展 名 ) 的 文件 名 或 
通过 浏览 查找 该 文件 。@ 在 “选择 目标 ”对 话 框 中 选择 Microsoft OLE DB Provider for 
SQL Server, 选 择 数据 库 服 务 器 ,然后 选择 所 用 的 身份 验证 方式 。 在 “指定 表 复 制 或 查 
询 ” 对 话 框 中 选择 从 数据 源 复制 表 和 视图 ”"。@ 在 “选择 源 表 和 源 视图 "对话 框 中 , 左 
侧 列 出 了 Access 数据 库 中 的 所 有 表 , 单 击 表 前 的 检查 框 表示 将 其 导入 。 该 名 字 就 会 出 
现在 右 侧 列表 。 默 认 导入 的 表 名 保持 不 变 。 若 需要 改名 , 则 在 名 字 上 单 击 , 出 现 插入 
点 后 修改 成 新 的 名 字 即 可 。 例 如 ,把 “会 计 科目 表 ” 改 名 为 “会 计 科目 ”。 单 击 “ 下 一 步 ” 
按钮 ,选择 “立即 运行 "。 导 入 视图 时 会 把 源 视图 里 所 有 的 真实 数据 导入 成 一 个 新 表 ， 


而 不 是 视图 。 
从 Access 数据 库 导 和 SQL Server 的 导入 过 程 如 图 3-2 所 示 。 
I 
<< 驱 动 >> << 工 具 >> << 驱 动 >> 
Access SQL Server 导入 导出 向 导 OLE DB 
有 发 出 请 求 发 出 请 求 
< 
<< 数 据 库 >> 
东山 县 医院 财 
务 数 据 mdb 我 的 数据 库 
Access 是 过 返回 结果 SQL Server 
r “| 处 理 结果 
一 -二 插入 结果 上 | 


图 3-2 从 Access 导入 SQL Server 的 导入 过 程 


由 于 SQL Server 中 的 数据 类 型 与 Access 中 的 数据 类 型 不 同 ,所 以 导入 导出 向 导 按 
照 默认 的 数据 类 型 对 应 进行 转换 , 见 表 3-2。 


表 3-2 


SQL Server 导入 导出 向 导 默 认 的 数据 类 型 对 应 


Access SQL Server 是 否 允 许 空 
文本 (255) nvarchar (255) NULL 
备注 nvarchar(max) NULL 
数字 ( 字 节 ) tinyint NULL 
数字 ( 整 型 ) smallint NULL 
数字 (长 整 型 ) int NULL 
数字 ( 单 精度 ) real NULL 
数字 ( 双 精 度 ) float NULL 
日 期 /时 间 datetime NULL 
货币 money NULL 
是 / 否 bit NOT NULL 
自动 编号 int NOT NULL 


如 果 要 更 改 默认 的 数据 类 型 ,一 种 方法 是 转换 后 在 SQL Server 数据 库 中 通过 “设计 
表 ” 对 话 框 进行 修改 , 另 一 种 方法 是 转换 时 就 进行 修改 。 例 如 ,把 nvarchar 改 为 varchar 


类 型 ,如 图 3-3 所 示 。 


人 创建 目标 表 (B) 
个 网 除 目标 表 中 的 行 妈 
个 向 目标 表 中 追加 行 D) 


会 计 科 目 表 
[as]. [会 计 科目 ] 


编辑 SL | 
厂 删除 并 重新 创建 目标 表 (0) 
厂 启用 标识 插入 (DD 


varchar 
nvarchar 
int 
nvarchar 
nvarchar 
nvarchar 
nvarchar 
int 
snallint 
smallint 


同 司 习习 可 习习 习习 癌 


科目 编码 YarChar (254) WOT InULL 


图 3-3 更 改 默认 的 数据 类 型 映射 


ER EE 


选择 源 表 和 视图 时 ,如 果 想 修改 会 计 科 目 表 的 数据 类 型 ,就 单 击 * 编 辑 映射 >。 在 “ 列 
映射 ?对 话 框 中 选择 “目标 ”中 * 类 型 "的 下 拉 列 表 , 从 中 选择 需要 的 数据 类 型 ,如 varchar， 


把 大 小 由 默认 254 改 为 9。 


接 下 来 讨论 ODBC 途径 的 导入 。 
在 SQL Server 2008 中 ,导入 导出 向 导 支 持 的 外 部 数据 源 较 多 ,如 图 3-4 所 示 。 其 中 


有 些 是 新 增 的 。 


图 .Net Framenrork Dats Provider for 0dbe 
Net Franework Data Provider for Oracle 
入 et Franerork Data Provider for SqlServer 
留 wediscataloenB OLE DB Provider 
鲜 mediscataloalergeaDB OLE DB Provider 
镶 mediscataloslebDB OLE DB Provider 
ANicrosoft Mccess 
KEMicrosoft Excel 
Mierosoft OLE DB Provider for Analysis Services 10.0 
@Nicrosoft OLE DB Provider For Data Mining Services 
国 Wicrosoft OLE DB Provider for Internet Publishing 
世 Wicrosoft OLE DB Provider for OLAP Services 8.0 
0Wicrosoft OLE DB Provider for Oracle 
Nicrosoft OLE DB Provider for SQL Server 
目 SQL Server Native Client 10.0 
大 平面 文件 源 


图 3-4 数据 源 


这 些 数据 源 可 以 分 为 三 类 。 一 是 . NET Framework Data Provider 提供 的 访问 方式 ， 
如 .NET 为 ODBC、Oracle、SQL Server 提供 了 访问 ,安装 . NET 后 , 即 可 使 用 这 些 访问 方 
式 。 二 是 OLE DB Provider 提供 的 访问 方式 。 安 装 Visual Studio 等 开发 工具 后 , 即 可 使 
用 这 些 访 问 方式 。 三 是 特定 应 用 系统 的 驱动 ,如 Excel, 安 装 Excel 之 后 自 带 。 

ODBC 途径 分 为 3 个 步骤 : 第 一 步 ,建立 访问 Access 数据 库 (C: \data\ 东 山 县 医院 
业务 数据 . mdb) 的 ODBC 数据 源 ; 第 二 步 , 建 立 接收 Access 数据 库 (C: \data\ 东 山 县 医 
院 业 务 数据 . mdb) 中 的 表 或 者 视图 的 SQL Server 数据 库 ; 第 三 步 ,运行 SQL Server 导入 
导出 向 导 ( 导 入 和 导出 ) ,执行 导入 。ODBC 途径 的 数据 流 如 图 3-5 所 示 。 


ODBC 


Access 


具体 步 又 如 下 。 


= 


图 3-5 ODBC 途径 的 数据 流 


第 一 步 ,建立 ODBC 数据 源 , 让 SQL Server 导入 导出 向 导 通 过 该 数据 源 访问 东山 县 


医院 财务 数据 . mdb。 


(1) 双击 “控制 面板 ”的 “管理 工具 ”中 的 “数据 源 (ODBC)”, 会 看 到 “ODBC 数据 源 管 
理 器 ”对 话 框 ,如 图 3-6 所 示 。 注 意 ,该 对 话 框 中 当前 显示 的 选项 卡 是 “用 户 DSN( 数 据 源 


国外 分 入 : 风 的 国 到 内 区 吉 


名 )” 选 项 卡 。 用 户 数据 源 仅 对 当前 用 户 可 见 ,而 且 仅 能 用 于 当前 计算 机 上 ;对 系统 级 数据 
库 来 说 ,使 用 “系统 DSN” 选 项 卡 。 系 统 数据 源 对 当前 计算 机 上 的 所 有 用 户 可 见 ;对 文件 
级 数据 源 (从 严格 意义 上 说 , 它 不 是 数据 库 ) ,使 用 “文件 DSN” 选 项 卡 。 文 件数 据 源 可 以 
由 安装 了 相同 驱动 程序 的 用 户 共享 。 


| 册 记 sw| 系统 DSN 
系统 堵 据 源 @); 
和 驱动 和 序 国 


downdbdsn 。 Microsoft Visual Foxpro Driver 
dworkdbdsn Microsoft Visual Foxpro Driver 


inputdsn 。 Microsoft Visusl Foxpro Driver 
modeldbdsn Microsoft Visusl Foxpro Driver 
SES Driver do Microsoft Access (#.mdb) 


ssworkdbdsn Microsoft Yisual Foxpro Driver 
xloworkdbdsn Microsoft Yisual Foxpro Driver 
zxworkdbdsn Microsoft Visual Foxpro Driver 
1 


0 


EEEaa ER | 5w ] ES 
图 3-6 查看 系统 数据 源 


对 本 地 数据 库 来 说 ,通常 要 在 用户 DSN” 选 项 卡 上 创建 一 个 项 ;对 远程 数据 库 来 说 ， 
则 要 在 “系统 DSN” 选 项 卡 上 创建 一 个 项 。 任 何 情况 下 都 不 能 在 用户 DSN” 和 “系统 
DSN” 选 项 卡 上 创建 同名 的 项 。 

(2) 选择 “系统 DSN” 选 项 卡 , 单 击 “ 添 加 ”按钮 会 看 到 “创建 新 数据 源 ” 对 话 框 ,如 
图 3-7 所 示 。 


soft Excel (#. x1s) 

soft Paradox (#.db ) 
Driver para o Microsoft Visusl FoxFro 
Microsoft Access dBASE Driver (#. dbf, 二 nd 
Microsoft Access Driver (endb) 


Microsoft Access Paradox Driver (+ db) 
‘ 


《上 一 步 @) 


3-7 创建 新 数据 源 


(3) 选择 一 个 数据 源 的 驱动 程序 。 对 本 例 选择 Microsoft Access Driver( *. mdb， 
x* .accdb) , 单 击 “完成 ?按钮 :出现 *<ODBC Microsoft Access 安装 ”对 话 框 ,如 图 3-8 所 示 。 


鲁 回 二 克昌 时 六 忆 四 绕 央 


Accounting 


数据 库 。 D:\...\ 导 入 导出 \ 东 山 县 医院 财务 数据 .ndb 


.| EO.. (总. (Ew. 


系统 数据 库 


回 无 四 
加 数据 库 加 ) 


图 3-8 “ODBC Microsoft Access 安装 ”对 话 框 


(4) 在 “数据 源 名 ”文本 框 中 输入 数据 源 名 称 。 一 定 要 选择 意义 明确 但 又 不 过 于 元 长 
的 名 称 。 输 入 Dongshan, 因 为 最 终 要 创建 一 个 与 东山 县 医院 有 关 的 数据 库 的 链接 。 

(5) 在 “说 明 ” 文 本 框 中 输入 一 段 说 明 性 文字 。 可 以 让 这 个 项 比 上 一 个 项 稍 长 一 些 ， 
因为 它 描述 数据 库 的 用 途 , 这 里 输入 Accounting。 

(6) 单 击 “ 选 择 ” 按 钮 ,会 看 到 一 个 “选择 数据 库 ” 对 话 框 ,可 以 在 那里 选择 一 个 现 有 的 
数据 库 。ODBC 驱动 程序 会 自动 选择 正确 的 文件 扩展 名 。 

(7) 单 击 “确定 ”按钮 关闭 “ODBC Microsoft Access 安装 ”对 话 框 。 应 该 看 到 ,新 的 设 
置 项 已 经 添加 到 “ODBC 数据 源 管理 器 ”对 话 框 中 ,如 图 3-9 所 示 。 如 果 今后 要 为 数据 库 
更 改 这 些 设置 ,选择 它 并 单 击 “ 配 置 " 按 钮 即 可 。 如 果 要 删除 数据 源 , 选 择 DSN 并 单 击 “ 删 
除 ” 按 钮 即 可 。 


Microsoft Access Driver (e.mdb, *.a| 
downdbdsn 。 Microsoft Visusl Foxpro Driver 
drworkdbdsn Microsoft Visusl Foxpro Driver 
inputdsn 。 Microsoft Visual Foxpro Driver 


和 
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图 3-9 添加 Dongshan 后 的 系统 数据 源 


第 二 步 , 参 见 在 SQL Server 中 通过 管理 器 创建 数据 库 的 步骤 ,创建 一 个 空 的 数据 库 
准备 存放 导入 的 表 。 不 妨 把 数据 库 命名 为 TEST。 
第 三 步 ,通过 选择 “导入 导出 向 导 ” 实 现 导入 。 


轩 且 分 入 : 风 的 国 到 内 区 吉 


(1) 在 “对 象 资 源 管理 器 中 右 击 TEST 数据 库 ,然后 选择 “任务 ”, 再 选择 “导入 数据 ”。 

(2) 在 “选择 数据 源 ” 对 话 框 中 选择 “. Net Framework Data Provider for Odbc” 数 据 
源 ; 在 Dsn 右 侧 的 文本 输入 框 中 输入 已 经 在 Windows 中 设置 好 的 数据 源 名 Dongshan , 单 
击 “ 下 一 步 ?按钮 ,如 图 3-10 所 示 。 


选择 娄 扣 尖 复制 数据 的 源 。 
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Dongshan 


图 3-10 选择 数据 源 


(3) 选择 目标 如 图 3-11 所 示 。 由 于 从 TEST 数据 库 出 发 启动 了 导入 导出 向 导 , 所 以 
默认 的 目标 是 TEST 数据 库 , 保 持 其 不 变 , 单 击 * 下 一 步 " 按 钮 。 


3-11 选择 目标 


鲁 辐 二 克昌 时 从 饭 四 绕 册 


(4) 选中 “复制 一 个 或 多 个 表 或 视图 的 数据 ”, 如 图 3-12 所 示 , 单 击 * 下 一 步 "按钮 。 


I 


| sa Sever SA 
指 吉 表 得 剂 和 涡 ，，ws 人 sim， 还 是 从 数据 源 复制 查询 结果 。 


《上 - 步 加 5 四 | | mA 


图 3-12 ”指定 表 复制 或 查询 


(5) 在 “选择 源 表 和 源 视图 ”窗口 左 侧 勾 选 表 和 视图 后 , 单 击 “ 下 一 步 "按钮 ,如 图 3-13 
所 示 。 


SQL Server 导入 和 号 
[Er 


表 和 视图 CD 


向 面 
| 
《< 上 -- 步 四 有 四 1 | mA | 


3-13 ”选择 源 表 和 源 视图 


(6) 勾 选 “立即 运行 ”, 单 击 “ 下 一 步 " 按 钮 。 确 认 要 做 的 事情 , 单 击 “ 完 成 ”按钮 。 

ODBC 途径 的 导入 各 部 件 间 的 调用 关系 如 图 3-14 所 示 。SQL Server 导入 导出 向 导 
的 数据 访问 请 求 通过 ODBC 驱动 软件 交 给 了 Access 驱动 软件 ,由 Access 驱动 实施 具体 
读 取 , 并 将 结果 通过 ODBC 交 给 SQL Server 导入 导出 向 导 。SQL Server 导入 导出 向 导 
再 通过 使 用 SQL Server 的 OLE DB 驱动 软件 把 数据 写 人 SQL Server 的 数据 库 。 注 意 ， 
为 了 方便 起 见 ,ODBC 途径 的 数据 导入 仍然 用 了 Access 数据 库 。 显 然 , 对 于 Access 来 


十 动人 邹 和 机 : 贝 的 网 到 内 区 电 


说 ,这 种 途径 比 直接 导入 Access 数据 库 复杂 。 但 是 ,对 于 非 Office 数据 库 , 如 DBASE 数 
据 库 , 则 只 能 使 用 此 途径 。 


< 驱动 > ||| << 驱 动 >> | -< 工具 > << 驱 动 >> 
Access ODBC SQL Server OLE DB 
<< 数 据 库 >> | EE 
<< 数 据 库 >> 

东山 县 医院 财 

务 数据 .mdb 

Access Yi TEST 库 
i SQL Server 


图 3-14 ”ODBC 途径 的 导入 各 部 件 间 的 调用 关系 
ODBC 数据 源 的 概念 如 图 3-15 所 示 。 


导入 和 U 东山 县 医院 
导出 向 导 Access .mdb 
驱动 程序 


ODBC 数据 源 


dongshan 
图 3-15 ODBC 数据 源 的 概念 


大 多 数 数据 库 厂商 都 提供 了 用 于 ODBC 的 驱动 程序 ,但 是 不 一 定 提供 用 于 某 个 第 三 
方 软件 (如 SQL Server 导入 导 出 向 导 ) 的 驱动 程序 。 所 以 ,ODBC 的 途径 对 于 访问 大 多 数 
数据 库 系 统 来 说 是 一 种 通用 的 途径 。 


3.3.2 ”把 文本 文件 导 人 SQL Server 
一 般 来 说 ,用 于 数据 交换 的 文本 文件 有 两 种 格式 : 字段 由 分 隔 符 分 隔 和 字段 固定 宽度 。 
分 隔 符 可 以 是 逗号 . 制 表 符 等 。 例 如 ,下 面 是 一 个 以 逗号 分 隔 字 段 的 文本 文件 银行 . txt 局 部 。 


银行 编码 ,业务 代码 ,名称 ,利率 ,开始 日 期 
500,100,90 年 五 年 期 财政 债券 利率 ,8.31,01/10/1997 
500,200, 开 发 银行 债券 利率 (12.5% ) ,10.41,01/10/1997 
500,201, 开 发 银行 债券 利率 (14s ),11.64,01/10/1997 


第 3) 龟 数 电 导入 导出 野 凡 
500,1100, 单 位 活期 存款 ,1.2,07/01/1998 


下 面 是 一 个 以 制 表 符 分 隔 字段 的 文本 文件 (贷款 利率 表 TAB) 局 部 。 


银行 编码 业务 代码 名 称 利率 ”开始 日 期 
500 100 0 年 五 年 期 财政 债券 利率 8.31 01/10/1997 
500 200 开发 银行 债券 利率 (12.5s ) 10.41 01/10/1997 
500 201 开发 银行 债券 利率 (14%) 。 11.64 01/10/1997 


500 1100 单位 活期 存款 1.2 07/01/1998 


由 于 制 表 符 是 控制 字符 ,控制 了 文本 的 位 置 ,所 以 有 时 从 视觉 上 无 法 区 分 是 单个 制 表 
符 , 还 是 多 个 空格 。 可 以 在 Microsoft Word 中 打开 该 文件 ,然后 打开 “工具 ”菜单 的 “ 选 
项 "菜单 项 ,在 “视图 ”选项 卡 的 “格式 标记 ”区 勾 选 “ 制 表 符 ”, 就 可 以 观察 制 表 符 号 了 。 

字段 固定 宽度 的 文本 文件 中 每 一 行 的 数据 都 包含 相同 的 字符 个 数 , 即 每 一 行 的 宽度 
相等 。 例 如 ,下 面 的 文本 文件 序号 字段 固定 3 个 字符 宽度 ,商品 名 称 固定 10 个 字符 宽度 ， 
数量 固定 3 个 字符 宽度 ,单价 和 金额 固定 9 个 字符 宽度 。 

序号 ”商品 名 称 数量 单价 金额 

01 ”隆盛 开心 果 2 37.00 74.00 

02 和 瞧 集 咖 啡 伴侣 眶 ) 1 23.20 23.20 

03 ”双汇 玉米 热狗 1 8.70 8.70 

04 衡水 老 白 干 淡雅 1 59.00 59.00 


下 面 演示 把 银行 . txt 导入 到 TEST 数据 库 的 过 程 。 

(1) 运行 导入 和 导出 数据 工具 ,在 弹出 的 “导入 和 导出 向 导 ” 窗 口 单 击 “ 下 一 步 ” 按 钮 ， 
在 “选择 数据 源 ” 对 话 框 的 数据 源 下 拉 列 表 中 选择 “平面 文件 源 ”, 并 在 文件 名 文本 框 中 输 
入 文件 名 或 者 打开 “文件 ”对 话 框 ,选择 所 要 的 文件 。 

在 “格式 ”设置 中 ,保持 默认 的 “ 带 分 隔 符 ”格式 不 变 。 文 本 文件 中 的 行 或 列 的 长 度 可 
以 是 固定 的 ,也 可 以 用 特殊 的 字符 分 隔 。 

当 将 数据 从 文本 文件 复制 到 新 的 SQL Server 表 时 , 列 的 大 小 默认 为 varchar(50) 。 
如 果 需 要 调整 列 的 大 小 设置 ,请 单 击 “高 级 ”选项 卡 修改 列 。 

“ 带 分 隔 符 ? 指 数据 在 文件 内 按 字段 对 齐 ,每 个 字段 均 由 相同 的 分 隔 符 分 隔 .“ 固 定 字 
段 " 指 数据 在 文件 内 以 等 宽 按 字段 对 齐 。 文 件 内 的 字段 对 所 有 数据 行 宽度 都 相等 。 然 而 ， 
在 同一 行 中 ,各 字段 宽度 都 可 以 不 同 。 

“文本 限定 符 ? 指 数据 文件 中 用 来 界定 文本 的 字符 标记 。 单 击 下 列 文本 限定 符 之 一 : 
双 引 号 . 单 引号 .无 ,也 可 以 输入 字符 ,用 作文 本 限定 符 。 如 果 文 本 没有 被 分 隔 ,而 文件 不 
是 “固定 字段 ”文件 , 则 该 属性 可 能 设置 为 默认 值 * 双 引号 ”。 

“标题 行 分 隔 符 ? 指 文件 中 各 行 以 某 种 字符 序列 彼此 分 离 。 单 击 下 列 分 隔 符 之 一 : 
CR( 回 车 )、LF( 换 行 符 )、; (分 号 )、,( 喜 号 )、 制 表 符 、| (垂直 条 ) ,也 可 以 输入 字符 ,用 作 行 
分 隔 符 。 如 果 文 件 是 固定 字段 文件 .就 选择 “无 选项。 


分 时: 网 交 国 到 因数 专 


“要 跳 过 的 标题 行 数 ” 指 从 文件 开头 起 不 想 复制 的 行 数 。 该 字段 与 “第 一 行 含有 列 名 
称 ” 字 段 一 起 使 用 。 如 果 没 有 勾 选 “在 第 一 个 数据 行 中 显示 列 名 称 ” 复 选 框 , 则 跳 过 的 行 数 
等 于 这 里 输入 的 数字 。 如 果 勾 选 了 “在 第 一 个 数据 行 中 显示 列 名 称 ” 复 选 框 , 则 跳 过 的 行 
数 不 包 括 标题 行 。 

“在 第 一 个 数据 行 中 显示 列 名 称 ” 指 文本 文件 的 第 一 行 含 有 列 标题 ,而 非 数据 。 

向 导 根 据 此 设置 ,能 够 自动 识别 列 。 单 击 左 侧 的 “ 列 ? 标 签 ,就 可 以 观察 显示 的 结果 。 
本 例 中 ,向 导 自 动 识别 文本 文件 中 共有 5 行 ,其 中 第 1 行为 标题 行 ,其 余 4 行为 数据 行 。 
共有 5 列 , 各 个 列 的 名 字 显 示 了 出 来 。 

根据 文本 文件 中 具体 的 列 间 分 隔 符 进行 选择 。 如 果 没 有 , 则 要 修改 文本 文件 ,在 各 列 
间 插 入 制 表 符 。 

(2) 单 击 *“ 下 一 步 ?按钮 ,选择 目标 服务 器 和 数据 库 。 

(3) 在 “选择 源 表 和 源 视图 ”对 话 框 中 ,保持 默认 设置 。 

当 将 数据 从 文本 文件 复制 到 新 的 SQL Server 表 时 , 列 的 数据 类 型 默认 为 Nvarchar 
(50)。 如 果 需 要 调整 列 的 数据 类 型 设置 ,请 单 击 * 编 辑 映射 ?按钮 修改 目标 列 , 最 后 单 击 
“完成 ”按钮 。 

对 于 固定 列 宽 的 文本 文件 ,还 可 以 先 将 其 导入 Access 数据 库 中 ,然后 再 从 Access 数 
据 库 中 导入 到 SQL Server 数据 库 中 。 下 面 演示 了 从 固定 列 宽 的 文本 文件 导入 到 Access 
数据 库 的 步骤 。 

第 一 步 ,在 Access 中 新 建 一 个 空 的 数据 库 ,不 妨 命名 为 “超市 . mdb”。 注 意 记 住 该 数 
据 库 在 磁盘 上 的 位 置 。 

第 二 步 ,在 Access 菜单 栏 中 选择 “外 部 数据 "菜单 , 单 击 “ 文 本 文件 ”工具 按钮 ,出 现 
“导入 ”对 话 框 ,在 “导入 ”对 话 框 中 首先 通过 “文件 类 型 "下 拉 列 表 框 指定 文本 文件 类 型 , 然 
后 选择 准备 导入 的 文本 文件 ,如 固定 宽度 . txt, 最 后 单 击 “ 确 定 ” 按 钮 。 

在 “导入 文本 向 导 ” 对 话 框 中 单 击 “ 高 级 …” 按 钮 ,出 现 如 图 3-16 所 示 的 “设置 导入 规 
格 ” 对 话 框 。 


| xszxm， es zmsm [CD Gm 
图 四 宇宙 度 Q) 。 文本 8 行 @)，[ 才 LI] 
语言 (0); 


E>- | 
人 而 (CD): 


日 期 、 时 间 和 数字 
日 项 序 四) 
日 期 分 隔 符 0) 


时 间 分 隔 符 中 ): 


3-16 设置 导入 规格 


第 (2 龟 数 曲 导入 导出 技术 


图 3-17 是 向 导 猜 测 的 结果 。 单 击 “ 确 定 ” 按 钮 关闭 对 话 框 。 


10 30 40 


[37.00 74.00 


入 吕 开心 昌 
惟 划 yn 件 但 


| 凤 汇 玉米 热狗 有 
衡水 老 白 干 淡雅 59. 00 59.00 
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图 3-17 调整 字段 位 置 


在 标尺 33 位 置 上 单 击 ,创建 一 个 新 的 分 割 线 , 以 此 调整 向 导 猜 测 结果 。 单 击 * 下 一 
步 ? 按 钮 。 
在 后 面 的 对 话 框 中 设置 各 个 字段 的 名 称 和 数据 类 型 ,如 图 3-18 所 示 。 


可 以 指定 有 关 正在 导入 的 生字 自 的 信息 在 下 面 列表 中 过 择 字 息 ， 然 后 在 “字段 和 页” 杠 内 对 字段 信息 进行 必要 的 更 效 
字段 选项 

字段 名 浆 寺 单价 | 

索引 四 ， 车 回 目 不 导入 字 自 的 过 ) G) 


商品 名 称 

隆盛 开心 果 

| 举 巢 咖啡 伴侣 
取 汇 玉米 热狗 
f 舌 水 老 白 干 淡雅 
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3-18 设置 数据 类 型 


选择 “序号 ”作为 主键 ,如 图 3-19 所 示 ,然后 单 击 “下 一 步 ?按钮 。 

设置 目标 表 的 名 字 为 “固定 宽度 ”, 以 完成 导入 。 

指定 表 名 , 单 击 “ 完 成 ?按钮 ,超市 . mdb 数据 库 中 就 出 现 了 指定 名 字 的 新 表 。 然 后 就 
可 以 从 Access 数据 库 把 该 表 导 入 到 SQL Server 数据 库 中 了 。 


审 动 分 析 : 从 其 系 到 类 数 揭 


旺 srosoft Access 建议 您 为 新 表 定 义 一 个 主键 。 主键 用 未 唯一 地 标识 表 中 的 每 个 记录 。 可 使 数据 


目 让 hcecess 添加 主键 仿 
Ee 
目 不 要 主 建 四 


区 重 合 价 
87. 00 
23. 20 
8.70 
59. 00 


» 
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图 3-19 设置 主键 
注意 : 在 导入 Access 数据 库 时 ,文本 文件 中 不 要 有 标题 行 。 
3.3.3 Visual FoxPro 数据 表 导 人 SQL Server 


假设 在 D: \Data\DBF 文件 夹 下 有 VFP 数据 库 文件 DBCKJ. DBC ,下面 将 其 导入 到 
SQL Server 中 的 TEST 数据 库 中 。 

首先 下 载 安 装 Microsoft OLE DB Provider for Visual FoxPro ,然后 在 TEST 数据 库 
上 右 击 ,启动 导入 导出 向 导 。 

在 “选择 数据 源 ” 对 话 框 中 选择 “Microsoft OLE DB Provider for Visual FoxPro”, 然 
后 单 击 “ 属 性 ”按钮 进行 设置 ;在 “数据 链接 属性 ”对 话 框 中 选择 或 者 输入 VFP 数据 库 的 名 
字 ; 单 击 “... ”按钮 ,首先 会 弹出 “配置 连接 "对话 框 ,询问 数据 库 类 型 : 是 VFP 数据 库 , 还 
是 自由 表 。 这 里 是 默认 选项 , 单 击 “Browse... ”按钮 选择 设置 该 数据 库 ; 保 持 “ 选 择 目标 ” 
对 话 框 中 的 默认 设置 ,其 余 步骤 同样 保持 默认 设置 。 

注意 : VFP 中 有 两 种 类 型 的 表 : 一 种 是 自由 表 ; 另 一 种 是 数据 库 中 的 数据 表 。 自 由 
表 是 一 个 单独 的 . DBF 文件 ,不 属于 任何 数据 库 。 对 于 数据 库 中 的 数据 表 , 除 了 有 相应 
的 .DBF 文件 外 ,一 般 在 同一 文件 夹 下 还 有 数据 库 文件 . DBC, 文 件 中 记载 了 该 数据 库 中 
拥有 哪些 数据 表 。 当 导入 . dbc 文件 时 ,应 确保 其 相应 的 . DBF 文件 也 存在 于 正确 的 磁盘 
位 置 上 。 


高 级 查询 分 析 技 术 


本 章 介 绍 SQL 应 用 的 一 些 高 级 内 容 , 包 括 视图 索引、 数据 字典 ,临时 表 、 存 储 过 程 、 
函数 .他 发 ,游标 等。 这 些 内 容 有 助 于 在 审计 数据 分 析 实 践 中 解决 较为 复杂 的 案例 。 


4.1 视 


视图 即 观 察 数据 的 窗口 。 通 过 SQL 语句 可 以 从 一 个 表 或 者 多 个 表 中 查询 符合 条 件 
的 数据 。 命 名 这 个 查询 并 保存 到 数据 库 中 ,就 是 视图 。 


首先 分 析 一 个 案例 。 假 设 在 “东山 县 医院 财务 库 ? 中 ,审计 人 员 和 希望 以 如 图 4-1 所 示 
格式 观察 凭证 库 中 的 数据 。 

须 凭 证 号 于 加 的 科目 名 称 摘要 借方 金额 。 贷方 金额 
W2003-10-13- 记 -5 102 银行 存款 收 社保 中 心 退 .. 3064. 6000 .0000 
2003-10-13- 记 -5 20720 其 他 收 社保 中 心 退 ..。 .0000 3064. 6000 
3 |2003-10-14- 记 -6 102 银行 存款 交 城建 税 .0000 554. 5800 
|2003-10-14- 记 -6 102 银行 存款 交 教 育 附加 .0000 237. 6800 
5 2003-10-14- 记 -6 20701 代 扣 个 人 所 得 税 交 个 人 所 得 税 84760. 0200 .0000 

I6 2003-10-14- 记 -6 21003 应 交 城 建 税 交 城 建 税 554. 5800 .0000 
e2003-10-14- 记 -6 20703 教育 费 附加 交 教 育 附 加 237. 6800 .0000 

8 2003-10-14- 记 -6 102 银行 存款 交 个 人 所 得 税 .0000 84760. 0200 
2003-10-14- 记 -6 102 银行 存款 交 营 业 税 .0000 7922. 5000 
10 |2003-10-14- 记 -6 21002 应 交 营 业 税 交 营业 税 7922. 5000 .0000 
2003-10-14- 记 -7 101 现金 于 小 宝 报 子 女 .. .0000 1846. 2400 
2 2003-10-14- 记 -7 30301 职工 福利 基金 于 小 宝 报 子 女 ..。 1846. 2400 .0000 

图 4-1 查询 凭证 库 


其 特点 是 : 结果 集中 只 有 凭证 库 表 中 的 部 分 列 , 列 的 顺序 与 凭证 库 表 中 列 的 原始 顺 
序 不 同 ,而 且 只 显示 2003 年 10 月 份 的 赁 证。 那么 ,通常 的 思路 是 在 SQL 查询 编辑 器 中 
执行 查询 : 

SEIECT 源 赁 证 号 ,科目 编码 ,科目 名 称 , 摘 要 ,借方 金额, 贷方 金额 

FROM 凭证 库 

WHERE 会计 年 份 =2003 AND 会 计 月 份 =10 

由 于 一 个 审计 项 目 可 能 持续 几 个 月 ,每 次 打开 数据 库 发 出 这 样 的 查询 显然 很 烦琐 。 
对 于 这 种 情况 ,有 的 审计 人 员 把 查询 结果 保存 在 表 中 。 


SEIECT 源 凭证 号 ,科目 编码 ,科目 名 称 ,摘要 ,借方 金额 ,贷方 金额 


Im 双 表 


FROM 凭证 库 
WHERE 会 计 年 份 =2003 AND 会 计 月 份 =10 


以 后 查询 时 ,只 使 用 以 下 查询 就 可 以 了 。 


SEIECT 关 

FEOM 六 表 

这 种 办 法 的 缺点 是 数据 元 余 。 可 以 视图 的 形式 在 数据 库 中 保存 查询 ,需要 时 从 视图 
中 进行 查询 ,而 不 是 直接 从 表 中 进行 查询 ,以 避免 数据 元 余 。 使 用 视图 前 必须 先 定义 视 
图 。 定 义 视图 的 SQL 语句 为 

CREATE VIEW 凭证 库 借贷 视图 

RS 

SETEcr 源 凭证 号 ,科目 编码 ,科目 名 称 ,摘要 ,借方 金额 ,贷方 金额 

FECM dbo. 凭 证 库 

WHERE 会 计 年 份 =2003 AND 会 计 月 份 =10 

在 对 象 浏览 器 中 展开 “东山 县 医院 财务 库 " 数 据 库 , 并 展开 视图 ,发 现 其 中 有 了 “dbo. 凭 
证 库 借贷 视图 ”对 象 ,如 图 4-2 所 示 。 


mesa | 多 | 古色 久 |D 台 日 | 风 有 
ET me EAE TE | 


Ri -Donsia Dong ET 
1 日 CREATE VIEW 凭证 库 借贷 视图 
2|as 


3 | SELECT 源 插 证 号 ,科目 编码 ,科目 名 称 ,摘要 ,借方 金额 , 贷方 金额 
4|| FROM 凭证 库 
5|-WHERE 会 计 年 份 ~2003 AND 会 计 月 份 ~ 10 


图 4-2 创建 及 查看 视图 
定义 视图 以 后 ,就 可 以 像 使 用 表 一 样 使 用 视图 了 。 例 如 : 


SETECT * 


FROM 凭证 库 借贷 视 图 
也 可 以 在 查询 中 增加 其 他 子 句 : 


SETECT * 
EFCOM 凭 证 库 借贷 视图 
ORDER BY 源 凭证 号 


前 四 图 请 多 外交 分 而 全 天 


可 以 把 视图 理解 为 “ 虚 表 ”, 或 者 观察 表 的 “窗口 ”。 凭 证 库 借贷 视图 和 凭证 库 表 的 关 
系 如 图 4-3 所 示 。 


凭证 库 
胖 站 编码 科目 名 称 摘要 凭证 日 期 借方 金额 贷方 金额 。 凭证 类 型 凭证 号 附件 数 _- 
L101 ~ 现金 提 备 用 金 差旅费 2003-03-2. . 。 40000. 0000 .0000 记 39..。 lo-” 


2 101 全 ~ 防 处 奖金 2 上 本 40~=1 
[5o4olo10... i 二 
4 


凭证 库 借贷 视 5。 


图 4-3 凭证 库 借贷 视图 和 凭证 库 表 的 关系 


注意 : 视图 名 中 不 能 含有 空格 等 特殊 符号 ;一 般 发 出 创建 命令 后 需 刷 新 对 象 浏览 器 ， 
才能 在 其 中 显示 出 来 。 

在 审计 实践 中 通常 对 视图 进行 修改 .如 对 上 面 的 视图 增加 一 列 : 附件 数 。 那 么 ,首先 
在 查询 编辑 器 对 象 浏 览 器 中 把 凭证 库 借贷 视图 删除 ,在 SQL 查询 编辑 器 的 对 象 浏览 器 中 
展开 视图 文件 夹 ,在 准备 删除 的 凭证 库 借 贷 视图 对 象 上 右 击 .选择 “删除 ”命令 。 

或 者 使 用 命令 DROP VIEW 删除 视图 。 例 如 : 


DEOP VIEW 凭证 库 借贷 视图 
然后 执行 下 面 的 查询 重新 创建 : 


CREATE VIEW 凭证 库 借贷 视图 
as 


SEIECT 源 凭证 号 ,科目 编码 ,科目 名 称 ,摘要 ,借方 金额 ,贷方 金额 ,附件 数 
FPCM dbo. 凭 证 库 
WHERE 会 计 年 份 =2003 AND 会 计 月 份 =10 


如 果 不 先 删 除 旧 的 视图 ,而 直接 创建 与 旧 视 图 相同 名 字 的 视图 ,就 会 出 现 以 下 错误 
信息 : 


服务 器 : 消息 2714, 级 别 16, 状 态 5, 过 程 凭证 库 借 贷 视图 , 行 3 
数据 库 中 已 存在 名 为 凭证 库 借 贷 视图 ' 的 对 象 。 


审 动 分 析 : 从 其 条 到 类 数 揭 


由 于 视图 是 基于 “ 基 表 ”的 一 个 数据 观察 窗口 ,并 没有 对 原始 数据 做 任何 改变 ,所 以 维 
护 了 数据 的 原始 性 。 可 以 通过 视图 授权 普通 用 户 访 问 账单 表 的 局 部 信息 。 例 如 ,会 计 科 
目 表 的 收入 类 科目 的 凭证 不 允许 普通 用 户 访 问 ,可 以 通过 为 普通 用 户 定义 视图 实现 。 

例如 ,为 了 对 普通 用 户 隐藏 药品 的 进 价 , 可 基于 “药品 " 表 创 建 一 个 没有 “单价 ” 列 的 
视图 。 


CREATE VIEW 药品 信息 

ns 

SEIECT 药品 编号 , 名 称 , 规格 ,基本 单位 , 出 售 单位 , 因子 
FROM 药品 


然后 通过 授权 操作 ,使 得 普通 用 户 可 以 查看 该 视图 ,但 不 能 查看 药品 表 。 
使 用 视图 可 以 方便 地 实现 数据 单位 变换 。 例 如 ,假设 药品 表 的 进 价 单位 是 美元 ,可 创 
建 以 人 民 币 元 为 单位 的 凭证 库 。 假 设 汇率 为 6. 3。 


CREATE VIEW 药品 进 价 信息 编号 , 名 称 , 人 民 币 进 价 ) 
PS 

SEIECT 药品 编号 , 名称 , 进 价 * 6.3 

EECM 药品 


使 用 视图 还 可 以 简化 复杂 查询 的 构造 。 对 于 复杂 查询 ,特别 是 连接 查询 ,可 先 建立 视 
图 ,再 基于 视图 查询 。 

例如 ,使 用 东山 县 医院 业务 数据 库 , 以 门诊 流水 号 ,部门 号 .部门 名 称 ` 收 费 日 期 ` 医 生 
号 .医生 姓名 为 查询 结果 集中 的 列 观察 数据 ,可 创建 “门诊 收费 详细 信息 ”视图 ,该 视图 汇 
集 了 来 自 门诊 收费 部门 和 医生 3 个 表 的 信息 ,然后 从 该 视图 中 查询 数据 。 

首先 ,创建 视图 。 创 建 视图 前 ,首先 清楚 从 哪些 表 中 获得 所 期 望 的 列 。 门 诊 流水 号 、 
部 门 号 .医生 号 .收费 日 期 来 自 门诊 收费 表 ; 而 门诊 收费 表 中 的 部 门 号 和 医生 号 分 别 引用 
了 部 门 表 中 相应 的 行 和 医生 表 中 相应 的 行 ,根据 该 引用 关系 ,从 部 门 表 中 可 以 找到 相应 的 
部 门 名 称 , 从 医生 表 中 可 以 找到 相应 的 医生 姓名 。 所 以 ,根据 该 引用 关系 建立 连接 条 件 
如 下 。 


SETLRCT 
FROM 门诊 收费 INNER JOIN 医生 Ny 医生 .医生 号 = 门诊 收费 .医生 号 
INNER JomN 部 门 oN 部 门 部门 号 = 门诊 收费 部门 号 


然后 分 别 从 相应 表 中 指定 结果 集中 期 望 显示 的 列 。 首 先是 来 自 门诊 收费 中 的 列 : 


SETIRCT 门诊 收费 .门诊 流水 号 , 门诊 收费 .部 门 号 ,门诊 收费 .收费 日 期 ,门诊 收费 .医生 号 
EROM 门诊 收费 TINER JomN 医生 oN 医生 .医生 号 = 门诊 收费 .医生 号 
ZINER gOIN 部 门 oN 部 门 -部门 号 = 门诊 收费 .部 门 号 


之 后 ,在 SELECT 子 句 中 添加 来 自 部 门 表 的 部 门 名 称 。 注 意 , 位 置 与 要 求 须 保持 一 致 。 
seracT 门诊 收费 门诊 流水 号 ,门诊 收费 .部门 号 部 门 .名 称 ,门诊 收费 .收费 日 期 , 门诊 收费 . 医 
生 号 
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FROM 门诊 收费 PRNER JoN 医生 CN 医生 .医生 号 = 门诊 收费 .医生 号 

TINER JOIN 部 门 ON 部 门 部门 号 = 门诊 收费 部门 号 

最 后 ,在 SELECT 子 句 中 添加 来 自 医 生 表 的 医生 姓名 。 注 意 ,位 置 与 要 求 要 保持 
一 致 。 

SETIRCT 门诊 收费 .门诊 流水 号 , 门诊 收费 .部 门 号 ,部门 -名称 , 门 诊 收费 .收费 日 期 ,门诊 收费 . 医 

生 号 , 医生 .姓名 

EPROM 门诊 收费 INNER JOIN 医生 CN 医生 .医生 号 = 门诊 收费 .医生 号 

INER JomN 部 门 ON 部门 部 门 号 = 门诊 收费 部 门 号 

当 看 到 该 查询 的 执行 结果 是 所 期 望 的 结果 后 .在 SELECT 子 句 上 方 添 加 两 行 ,创建 
VIEW。 


CREATE VIEW 门诊 收费 详细 信息 

RS 

SETECT 门诊 收费 .门诊 流水 号 , 门诊 收费 .部 门 号 , 部门 .名 称 , 门诊 收费 .收费 日 期 ,门诊 收费 .医生 
号 , 医生 .姓名 

FRCM 门诊 收费 ITNNER JOIN 医生 cN 医生 .医生 号 = 门诊 收费 .医生 号 

TNER JOIN 部 门 ON 部 门 .部 门 号 = 门诊 收费 部门 号 

以 后 就 可 以 基于 该 视图 做 简单 查询 了 。 


SEIECT * 
FROM 门诊 收费 详细 信息 
当然 ,也 可 以 从 中 查询 部 分 列 。 


SEIECT 门 诊 流水 号 , 名称, 姓名 
FROM 门诊 收费 详细 信息 


4.2 应 用 索引 加 快 查询 


想象 一 个 庞大 的 图 书馆 ,如 果 想 从 其 中 取 一 本 书 , 有 两 种 方法 : 顺序 查找 和 索引 查 
找 。 顺 序 查找 指 从 书架 上 一 本 书 一 本 书 挨个 翻 ;而 索引 查找 则 需要 辅助 设施 一 一 索引 卡 ， 
先 根据 书 名 到 索引 卡 中 检索 书 在 书架 上 的 位 置 , 然 后 直接 到 书架 位 置 上 取 书 。 

从 数据 库 中 检索 一 条 记录 就 相当 于 从 图 书馆 中 找 一 本 书 , 要 想 迅速 找到 该 记录 ,就 必 
须 事先 建立 索引 。 


4.2.1 索引 的 类 型 
1. 从 实现 角度 划分 


从 实现 角度 划分 ,有 两 种 类 型 的 索引 : 聚 簇 索引 和 非 聚 簇 索 引 。 
在 聚 簇 索 引 中 , 行 的 索引 顺序 与 物理 存储 顺序 完全 相同 。 由 于 聚 簇 索 引 的 顺序 与 数 
据 行 存放 的 物理 顺序 相同 ,所 以 聚 簇 索 引 最 适合 范围 搜索 。 因 为 找到 一 个 范围 内 开始 的 
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FROM 门诊 收费 PRNER JoN 医生 CN 医生 .医生 号 = 门诊 收费 .医生 号 

TINER JOIN 部 门 ON 部 门 部门 号 = 门诊 收费 部门 号 

最 后 ,在 SELECT 子 句 中 添加 来 自 医 生 表 的 医生 姓名 。 注 意 ,位 置 与 要 求 要 保持 
一 致 。 

SETIRCT 门诊 收费 .门诊 流水 号 , 门诊 收费 .部 门 号 ,部门 -名称 , 门 诊 收费 .收费 日 期 ,门诊 收费 . 医 

生 号 , 医生 .姓名 

EPROM 门诊 收费 INNER JOIN 医生 CN 医生 .医生 号 = 门诊 收费 .医生 号 

INER JomN 部 门 ON 部门 部 门 号 = 门诊 收费 部 门 号 

当 看 到 该 查询 的 执行 结果 是 所 期 望 的 结果 后 .在 SELECT 子 句 上 方 添 加 两 行 ,创建 
VIEW。 


CREATE VIEW 门诊 收费 详细 信息 

RS 

SETECT 门诊 收费 .门诊 流水 号 , 门诊 收费 .部 门 号 , 部门 .名 称 , 门诊 收费 .收费 日 期 ,门诊 收费 .医生 
号 , 医生 .姓名 

FRCM 门诊 收费 ITNNER JOIN 医生 cN 医生 .医生 号 = 门诊 收费 .医生 号 

TNER JOIN 部 门 ON 部 门 .部 门 号 = 门诊 收费 部门 号 

以 后 就 可 以 基于 该 视图 做 简单 查询 了 。 


SEIECT * 
FROM 门诊 收费 详细 信息 
当然 ,也 可 以 从 中 查询 部 分 列 。 


SEIECT 门 诊 流水 号 , 名称, 姓名 
FROM 门诊 收费 详细 信息 


4.2 应 用 索引 加 快 查询 


想象 一 个 庞大 的 图 书馆 ,如 果 想 从 其 中 取 一 本 书 , 有 两 种 方法 : 顺序 查找 和 索引 查 
找 。 顺 序 查找 指 从 书架 上 一 本 书 一 本 书 挨个 翻 ;而 索引 查找 则 需要 辅助 设施 一 一 索引 卡 ， 
先 根据 书 名 到 索引 卡 中 检索 书 在 书架 上 的 位 置 , 然 后 直接 到 书架 位 置 上 取 书 。 

从 数据 库 中 检索 一 条 记录 就 相当 于 从 图 书馆 中 找 一 本 书 , 要 想 迅速 找到 该 记录 ,就 必 
须 事先 建立 索引 。 


4.2.1 索引 的 类 型 
1. 从 实现 角度 划分 


从 实现 角度 划分 ,有 两 种 类 型 的 索引 : 聚 簇 索引 和 非 聚 簇 索 引 。 
在 聚 簇 索 引 中 , 行 的 索引 顺序 与 物理 存储 顺序 完全 相同 。 由 于 聚 簇 索 引 的 顺序 与 数 
据 行 存放 的 物理 顺序 相同 ,所 以 聚 簇 索 引 最 适合 范围 搜索 。 因 为 找到 一 个 范围 内 开始 的 
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行 后 ,可 以 很 快 地 取出 后 面 的 行 。 

因为 一 个 表 中 的 行 只 能 有 一 个 物理 顺序 ,所 以 每 个 表 只 能 有 一 个 聚 簇 索引。 如果 表 
中 没有 创建 其 他 的 聚 簇 索引 , 则 在 表 的 主键 列 上 自动 创建 聚 秘 索 引 。 

非 聚 簇 索 引 并 不 在 物理 上 排列 数据 , 即 索 引 中 的 逻辑 顺序 并 不 等 同 于 表 中 行 的 物理 
顺序 。 索 引 仅 记录 指向 表 中 行 的 位 置信 息 , 通 过 这 些 信息 可 以 在 表 中 快速 地 定位 数据 。 
可 以 为 表 中 每 个 常用 于 查询 的 列 定义 非 聚 簇 索引 。 

非 聚 簇 索 引 的 特点 使 它 很 适合 于 那 种 直接 匹配 单个 条 件 的 查询 ,而 不 太 适 合 于 返回 
大 量 结 果 的 查询 。 为 一 个 表 建 立 的 索引 默认 都 是 非 聚 徐 索 引 。 如 果 在 某 一 列 上 设置 唯一 
性 约束 ,也 会 自动 在 该 列 上 创建 非 聚 徐 索 引 。 


2 从 功能 角度 划分 


从 功能 角度 划分 ,也 有 两 种 索引 : 唯一 性 索引 (Unique Indexes) 和 非 唯一 性 索引 。 

唯一 性 索引 能 够 保证 在 创建 索引 的 列 或 多 列 的 组 合 上 不 包括 重复 的 数据 , 聚 簇 索引 
和 非 聚 簇 索引 都 可 以 是 唯一 性 索引 。 在 创建 主键 约束 和 唯一 性 约束 的 列 上 会 自动 创建 唯 
一 性 索引 。 

创建 唯一 性 索引 时 ,应 保证 创建 索引 的 列 不 包括 重复 的 数据 ,并 且 没 有 两 个 或 两 个 以 
上 的 空 值 。 因 为 创建 索引 时 将 两 个 空 值 也 视 为 重复 的 数据 ,如 果 有 这 种 数据 ,必须 先 将 其 
删除 ,否则 索引 不 能 成 功 创建 。 


4.2.2 索引 的 创建 


可 以 在 SQL 编辑 器 中 使 用 SQL 命令 创建 索引 。 例 如 ,在 “门诊 收费 明细 "? 表 的 “项 目 
编号 ? 列 上 建立 索引 IX_MZ_XMBH。 

CEEATE INLEX IX MZ XMBH 

9 门诊 收费 明细 顺 目 编号 ) 

创建 索引 后 ,就 为 实现 对 大 规模 表 的 快速 检索 提供 了 基础 。 注 意 : 四 对 于 小 表 , 索 引 
对 于 提高 检索 性 能 没有 帮助 ; @ 索 引 提高 了 数据 的 检索 速度 ,但 降低 了 数据 的 更 新 速度 ; 
@ 对 于 用 来 进行 JOIN 的 列 ,建立 索引 将 大 大 提升 连接 性 能 ; 四 不 要 对 经 常 更 新 的 列 建 
立 索 引 。 


4.3 数据 字典 


数据 字典 是 关于 数据 的 数据 ,可 以 通过 数据 字典 获得 全 面 的 数据 库 信息 。 数 据 字典 
也 是 以 数据 表 和 视图 为 主要 存在 形式 的 。 

使 用 SQL Server 时 ,需要 事先 了 解 关 于 数据 的 信息 ,如 数据 库 对 应 的 磁盘 文件 ,数据 
库 中 的 表 和 视图 , 某 个 表 或 者 视图 中 列 的 个 数 以 及 每 一 列 的 名 称 、 数 据 类 型 长度、 精度 
(有 效 数字 的 位 数 )、 描 述 , 表 上 定义 的 约束 (NOT NULL、 RIMARY KEY、FOREIGN 
KEY、UNIQUE、CHECK), 表 上 定义 的 索引 、 触 发 器 。 
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下 面 以 * 东 山 县 医院 业务 库 ? 为 例 , 介 绍 如 何在 管理 器 中 查看 数据 字典 信息 。 
4.3.1 数据 文件 和 事务 日 志文 件 


在 对 象 资源 管理 器 中 的 “东山 县 医院 业务 库 ” 上 右 击 ,选择 “属性 ”, 然 后 单 击 “ 文 件 ” 选 
项 页 ,可 以 看 到 数据 库 “ 东 山 县 医院 业务 库 ” 的 数据 库 文件 的 文件 名 是 “D:\ 东 山 县 医院 业 
务 库 _Data. MDF”, 逻 辑 文件 名 是 “东山 县 医院 业务 库 _Data”。 物 理 文件 名 是 被 操作 系统 
使 用 的 文件 名 ;逻辑 文件 名 是 在 数据 库 服 务 器 中 使 用 的 数据 文件 名 。 路 径 指 该 文件 所 在 
的 文件 夹 。“ 东 山 县 医院 业务 库 ” 的 事务 日 志文 件 的 文件 名 是 “D:\ 东 山 县 医院 库 _Log. 
LDF”; 人 逻辑 文件 名 是 “东山 县 医院 业务 库 _Log”。 


4.3.2 表 定 义 


如 果 想 查看 “东山 县 医院 业务 库 ? 数 据 库 中 有 哪些 表 , 各 表 是 如 何 定义 的 , 表 上 有 哪些 
约束 和 索引 ,那么 在 对 象 资源 管理 器 中 单 击 “ 东 山 县 医院 业务 库 ? 左 侧 的 “十 ”, 展 开 该 结 
点 ,然后 单 击 “ 表 ”, 可 以 看 到 类 型 为 "用 户 ? 的 表 有 8 个 ,分 别 是 门诊 收费 明细 门诊 收费 、 
部 门 药品、 检查 项 目 . 医 生 、 住 院 收费 明细 和 住院 收费 。 被 审 单位 的 原始 生产 数据 存在 于 
用 户 表 中 。 其 他 表 是 SQL Server 自动 创建 的 表 , 存 放 数据 字典 信息 。 

单 击 “ 医 生 ” 表 前 的 “十 ”, 展 开 “ 医 生 ” 表 ,可 以 看 到 “医生 ” 表 中 有 医生 号 、 姓 名 和 部 门 
号 3 列 及 各 列 的 数据 类 型 等 。 部 门 号 列 上 的 取 值 允许 为 空 ,其 他 列 上 的 取 值 不 允许 为 空 。 

在 管理 器 * 键 "项 目 组 定义 的 主键 约束 的 名 字 是 PK_ 医 生 ,该 主键 建立 在 “医生 号 ? 列 
上 。 把 “医生 号 "定义 为 主键 ,使 得 数据 库 能 够 自动 维护 在 整个 表 的 所 有 行 在 “医生 号 ”上 
的 值 不 重复 而 且 不 为 空 。 还 定义 了 外 键 约束 ,其 名 字 为 *FK_ 医 生 _ 部 门 ”, 建 立 在 “部 门 
号 ” 列 上 。 


4.4 临 时 表 


4.4.1 客户 与 数据 库 服务 器 的 连接 


SQL Server 运行 在 服务 器 模式 下 。 客 户 ( 如 SQL 查询 编辑 器 ) 接 受用 户 的 输入 ,并 
将 用 户 输入 通过 与 服务 器 的 连接 发 送 给 SQL Server, 如 图 4-4 所 示 。 

每 一 个 查询 窗口 都 与 服务 器 保持 一 个 连接 。 可 通过 SQL 查询 编辑 器 的 状态 栏 查 看 
当前 的 连接 数目 。 

默认 情况 下 ,SQL Server 允许 无 限制 连接 数目 (默认 值 0) 。 在 对 象 资源 管理 器 中 右 
击 服务 器 ,选择 “属性 ”, 在 SQL Server 属性 对 话 框 的 “连接 ?选项 卡 中 可 以 重新 设置 连接 
数目 ,如 改 为 6。 重 新 启动 SQL Server 服务 ,使 得 该 设置 有 效 。 那 么 , 当 在 SQL 查询 编 
辑 器 中 打开 第 7 个 查询 窗口 时 ,将 会 出 现 失败 的 提示 信息 。 

客户 端 和 服务 器 可 以 部 署 在 不 同 计算 机 上 。 假 设 所 要 访问 的 实例 为 SQLDEV , 若 要 
远程 登录 SQL Server, 则 应 满足 两 个 前 提 : 一 是 SQL Server 的 登录 身份 为 Network 
Service; 二 是 服务 器 启用 了 Named Pipes 协议 和 TCP/IP。 
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选择 启动 菜单 | Microsoft SQL Server 2008 R2| 配 置 工具 |SQL Server 配置 管理 器 
(本 地 ) ,出 现 如 图 4-5 所 示 的 对 话 框 。 
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4-5 配置 管理 器 


国有 时 向 二 出击 分 杨 的 册 ， 


从 图 4-5 中 观察 到 SQL Server(SQLDEV) 的 登录 身份 为 LocalSystem。 右 击 该 行 ， 
从 弹出 的 菜单 中 选择 * 属 性 ,出 现 *SQL Server(SQLDEV) 属 性 ”对 话 框 ,在 该 对 话 框 中 
把 “内 置 账户 ”由 Local System 改 为 Network Service, 如 图 4-6 所 示 。 


服务 枯 态 正在 运行 
E 问 售 止 四 | ， 芹 信 外 | 重新 让 | 


[到 ][ 了 ] [应 用 |][ 部 助 


4-6 “SQL Server(SQLDEV) 属 性 ”对 话 框 


再 单 击 服务 器 的 SQL Server 网 络 配置 ,双击 “SQLDEYV 的 协议 ,启用 其 中 的 Named 
Pipes 和 TCP/IP, 如 图 4-7 所 示 。 


4 且 SQL Server 网 络 配置 
垦 SQLEXPRESS 的 协议 


剧 - sQLDEV 的 的 议 | 
”时 SQL Native Client 10.0 配置 


通过 重新 启动 服务 使 配置 生效 。 
4.4.2 临时 表 的 创建 与 删除 


临时 表 在 数据 库 中 临时 存在 , 当 用 户 从 数据 库 中 注销 或 者 连接 中 断后 ,临时 表 被 自动 
删除 。 临 时 表 位 于 tempdb 数据 库 中 ,tempdb 数据 库 是 SQL Server 安装 时 自动 创建 的 。 
有 本 地 和 全 局 两 种 类 型 的 临时 表 , 二 者 在 名 称 、 可 见 性 和 可 用 性 上 均 不 相同 。 本 地 临 
时 表 的 名 称 以 “# ”开头 ;它们 仅 对 当前 的 用 户 连 接 是 可 见 的 ; 当 用 户 从 SQL Server 实例 
断 开 连 接 时 被 自动 删除 。 全 局 临时 表 的 名 称 以 “##” 开 头 , 创 建 后 对 任何 用 户 都 是 可 见 
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的 , 当 所 有 引用 该 表 的 用 户 从 SQL Server 断 开 连接 时 被 自动 删除 。 例 如 ,如 果 用 户 甲 创 
建 名 为 “# 劳 务 费 ”的 本 地 临时 表 , 只 有 甲 能 对 该 表 执行 操作 且 在 断 开 连 接 时 该 表 被 自动 
删除 。 如 果 创 建 名 为 “## 劳 务 费 ” 的 全 局 临时 表 , 数 据 库 中 的 任何 用 户 均 可 对 该 表 执 行 
操作 。 如 果 该 表 在 甲 创建 后 没有 其 他 用 户 使 用 , 则 当 甲 断 开 连接 时 该 表 被 自动 删除 ;如 果 
该 表 在 甲 创建 后 有 其 他 用 户 使 用 , 则 SQL Server 在 所 有 用 户 断 开 连 接 后 删除 该 表 。 

创建 临时 表 的 语法 如 下 。 

CREATE TABIE #< 表 名 > (< 列 名 才 < 数 据 类 型 >,…, < 列 名 n>< 数 据 类 型 >) 

该 命令 在 tempdb 中 创建 临时 表 , 而 且 该 表 仅 对 其 创建 者 可 见 , 当 其 创建 者 从 数据 库 
中 断 开 连 接 后 ,被 自动 删除 。 

创建 全 局 临时 表 的 语法 如 下 。 

CREATE TABIE ##< 表 名 > (< 列 名 >< 数 据 类 型 >,…, < 列 名 n>< 数 据 类 型 >) 

下 面 的 操作 序列 演示 了 临时 表 的 特点 。 用 户 甲 创建 了 临时 表 # 人 ,然后 向 该 表 中 插 
入 了 一 行 数据 ;用 户 乙 连接 数据 库 , 会 发 现 无 法 使 用 该 表 ; 用 户 甲 断 开 连接 ,然后 重新 连 
接 , 会 发 现 该 临时 表 自 动 消失 了 。 

步骤 1, 从 SQL 查询 编辑 器 的 “文件 ?菜单 中 选择 “连接 ”, 用 户 甲 登录 ;创建 临时 表 。 

CRERTE TREIE #T (A char(30)，B int) 

INSERT #T VALUES ("YYY", 1) 

步骤 2, 从 SQL 查询 编辑 器 的 “文件 "菜单 中 选择 “连接 ”, 用 户 乙 登录 。 

步骤 3 ,在 用 户 乙 的 连接 中 : 


SEIECT * FROM #T 


显示 “无 此 对 象 "的 出 错 信息 。 

步骤 4, 从 SQL 查询 编辑 器 的 “文件 ”菜单 中 选择 “ 断 开 ”, 断 开 甲 的 连接 。 
步 台 5, 从 SQL 查询 编辑 器 的 “文件 "菜单 中 选择 “连接 ”, 甲 重新 登录 。 
步骤 6, 发 出 以 下 命令 : 


SEIECT # EROM #T 


显示 “无 此 对 象 ”的 出 错 信息 。 
也 可 以 使 用 INTO 子 句 创 建 临时 表 。 例 如 : 


SELECT * INTO#T FROM 凭 证 库 


4.5 设计 脚本 完成 计算 


脚本 (script) 是 由 数据 库 服务 器 引擎 执行 的 T-SQL 语句 序列 。 
4.5.1 案例 : 计算 个 人 所 得 税 
假设 税法 规定 ,个 人 月 收入 3500 元 以 内 ,个 人 所 得 税 为 0; 个 人 月 收入 超过 3500 元 ， 
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个 人 所 得 税 为 超出 部 分 乘 以 0. 05。 

现 要 求 给 定 个 人 月 收入 ,编程 计算 其 应 交纳 的 所 得 税 。 

首先 安排 一 个 存储 单元 存放 给 定 的 个 人 月 收入 ,然后 安排 一 个 存储 单元 存放 计算 结 
果 , 并 将 这 两 个 存储 单元 分 别 命名 为 @S 和 @T, 然 后 通过 T-SQL 脚本 进行 计算 。 完 成 计 
算 的 T-SQL 脚本 如 下 。 


DECIARE @S AS DECIMAL(7,2) 
DECIARE @T RS DECIMAL(7,2) 

SET @S = 1200 

IF@S<=3500 SET eT =0 

IF @S > 3500 SET @T = (@S - 3500) * 0.05 
FRINT @T 


当 查 询 编辑 器 看 到 


DECTARE @S RS DECIMAL(7,2) 
DECIARE @T RS DECIMAL(7, 2) 


后 ,就 安排 了 两 个 存储 单元 : 


@s @T 

准备 存放 带 小 数 点 的 数值 数据 。 

语句 SET @S = 1200 的 含义 是 把 数值 1200 存放 到 @S 中 ， 
@S| 1200 QT 


语句 
IE@S<=3500 SET @T=0 
的 含义 是 如 果 @S 中 的 数值 小 于 或 等 于 3500, 就 把 0 存放 到 @T 中 。 
语句 
IE QS > 3500 SET @T= (es -3500) * 0.05 


的 含义 为 如 果 @S 中 的 数值 大 于 3500, 就 把 表达 式 (@S 一 3500) * 0. 05 的 计算 结果 存放 
到 存储 单元 QT 中 。 
因为 当前 @S 中 存放 的 是 1200, 而 1200 二 一 3500, 所 以 应 当 把 0 存放 到 @T 中 。 


@S| 1200 0 QT 


程序 完成 计算 后 ,计算 的 结果 存放 在 存储 单元 中 ,并 不 能 自动 显示 在 屏幕 上 。 命 令 
PRINT @T 的 作用 是 把 @T 中 的 数据 显示 在 屏幕 上 。 

可 以 看 到 ,脚本 是 一 个 语句 序列 ,该 序列 完成 一 定 的 功能 。 脚 本 中 需要 声明 一 些 存储 
单元 用 来 存放 被 程序 处 理 的 数据 ,并 使 用 一 个 名 字 进 行 标识 , 称 为 变量 ,如 @S,@T。 向 
存储 单元 中 存放 数据 称 为 赋值 ,如 SET @S 二 1200 的 含义 是 把 数据 1200 存放 到 以 @S 
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标识 的 存储 单元 中 。 脚 本 是 顺序 执行 的 , 即 按照 语句 的 书写 顺序 逐条 执行 。 
4.5.2 标识 符 、 语 句 和 注释 


标识 符 是 由 字母 或 者 数字 字符 组 成 的 字符 串 。 通 常用 它们 表示 服务 器 名 ,数据库 名 、 
数据 库 对 象 名 .常量 .变量 ,存储 过 程 名 称 等 。 标 识 符 的 命名 须 遵守 以 下 规则 : 标识 符 最 
多 有 128 个 字符 ;标识 符 的 第 一 个 字符 必须 为 字母 .下 画 线 .@ 或 者 #。 以 @ 或 者 # 开 头 
的 标识 符 具 有 特殊 意义 。 程 序 中 使 用 的 变量 要 求 是 以 @ 为 首 的 标识 符 。 

一 条 T-SQL 语句 至 少 需要 包含 一 个 命令 , 即 一 个 表明 动作 意义 的 动词 。 例 如 ， 
SELECT 动词 请 求 服务 器 检索 出 若干 数据 行 ;UPDATE 动词 要 求 服务 器 改变 特定 行 的 
内 容 。 

T-SQL 脚本 包含 一 个 或 多 个 语句 。 

语句 GO 的 意思 是 将 上 一 GO 命令 后 输入 的 所 有 语句 发 送 给 SQL Server。 

注释 是 程序 代码 中 不 执行 的 文本 字符 串 ( 也 称 为 注解 ) 。 注 释 可 用 于 说 明代 码 或 暂时 
禁用 正在 进行 诊断 的 部 分 T-SQL 语句 和 批 处 理 。 使 用 注释 对 代码 进行 说 明 , 可 使 程序 
代码 更 易于 维护 。 注 释 可 用 于 说 明 程序 名 称 、 作 者 姓名 和 主要 代码 更 改 的 日 期 , 称 为 序言 
性 注释 ;也 可 用 于 描述 算法 , 称 为 功能 性 注释 。 

T-SQL 支持 两 种 注释 字符 : 

一 ( 双 连 字符 )。 这 些 注释 字符 可 与 要 执行 的 代码 处 在 同一 行 ,也 可 另 起 一 行 。 从 双 
连 字 符 开始 到 行 尾 均 为 注释 。 对 于 多 行 注释 ,必须 在 每 个 注释 行 的 开始 使 用 双 连 字符 。 

/< ... #/( 正 斜 杠 - 星 号 对 )。 这 些 注释 字符 可 与 要 执行 的 代码 处 在 同一 行 ,也 可 另 
起 一 行 ,甚至 在 可 执行 代码 内 。 从 开始 注释 对 〈/ * ) 到 结束 注释 对 (* /) 之 间 的 内 容 为 
注释 部 分 。 对 于 多 行 注释 ,必须 使 用 开始 注释 字符 对 (/* ) 开始 注释 ,使 用 结束 注释 字 
符 对 (x /) 结束 注释 。 注 释 行 上 不 应 出 现 其 他 注释 字符 。 下 面 是 示例 。 

-- 多 行 注释 的 第 一 行 

-- 多 行 注释 的 第 二 行 

SEIECT x FRIM 药 品 
/* 多 行 注释 的 第 一 行 
多 行 注释 的 第 二 行 * / 

SEIECT * FROM 医生 


4.5.3 变量 


T-SQL 变量 是 保存 特定 类 型 的 单个 数据 值 的 对 象 。 变 量 必须 先 声明 ,后 使 用 。 

用 DECLARE 语句 声明 变量 ,并 用 SET 或 SELECT 语句 给 其 指派 值 。 所 有 变量 在 
声明 后 都 被 初始 化 为 NULL。 

声明 变量 的 语法 : 

TecraRE 8 局 部 变量 名 数据 类 型 

例如 : 
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DECIARE @S INT 

注意 ,变量 名 必须 以 字符 “@” 开 头 。 
变量 的 赋值 语法 为 

SET 8 局 部 变量 名 =< 值 > | < 表达 式 > 


声明 变量 后 ,所 有 变量 均 初始 化 为 NULL。 使 用 SET 语句 将 一 个 不 是 NULL 的 值 
赋 给 变量 。 当 初始 化 多 个 变量 时 ,为 每 个 局 部 变量 使 用 一 个 单独 的 SET 语句 。 
例如 ,计算 两 个 变量 的 和 并 显示 结果 的 脚本 为 


DECIARE @x int, @y int, @r int 
SET @x =156 

SET @y =26 

SET @r =@x +@y 

PRINT er 


4.5.4 流 控制 语句 IF-ELSE 
在 下 面 计算 个 人 所 得 税 的 例子 中 : 


DECIARE 6S RS DECTMRL (7,2) 
DECIARE @T RS DECIMAL(7, 2) 

SET 6S = 1200 

下 6s<=3500 sET @T=0 

下 6S > 3500 SET @T = (8S - 3500) * 0.05 
PRINT @T 


计算 部 分 是 IF 开头 的 语句 。 这 样 的 语句 只 有 在 IF 后 面 的 条 件 满足 时 , 才 执 行 后 面 
的 命令 , 称 为 控制 流 语句 。 

IF-ELSE 是 典型 的 分 支 控制 结构 ,其 用 法 有 两 种 : 有 IF 而 无 ELSE 的 IF 语句 和 有 
IF 也 有 ELSE 的 IF 语句 。 

有 IF 而 无 ELSE 的 IF 语句 的 语法 如 下 。 

IE< 条 件 > 

< 语句 1 语句 块 人 > 

当 二 条 件 二 成 立时 ,执行 IF 语句 中 的 语句 或 语句 块 ; 当 条 件 不 成 立时 , 跳 过 IF 语句 

后 的 语句 或 语句 块 。 


4.5.5 BEGIN…END 


BEGIN 和 END 语句 用 于 将 多 个 T-SQL 语句 组 合 为 一 个 语句 块 。 任 何 时 候 , 当 控 
制 流 语句 必须 执行 一 个 包含 两 条 或 两 条 以 上 T-SQL 语句 的 语句 块 时 ,使 用 BEGIN 和 
END 语句 。 

例如 ,计算 个 税 ,如 果 收 入 小 于 或 等 于 3500 元 ,个 税 为 0, 并 显示 “ 低 收入 ”; 如 果 收 入 
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大 于 3500 元 ,税率 为 5% ,并 显示 ”工薪 收入 ”。 一 种 可 能 的 脚本 设计 为 


DECIARE eincame int，etax int 
SET @inccme = 1000 
IE eincome <= 3500 

SET etax =0 

FRINT ' 低 收入 ' -- 当 条 件 满足 ,显示 “ 低 收入 ” 
IEF eincame > 3500 

SET etax = (einoame 3500) * 0.05 

FRINT ' 工 薪 收 入 ' 
PRINT @tax 


则 当 @income 王 1000 时 会 出 现 ， 


低 收入 
工薪 收入 
0 


的 输出 结果 。 这 与 题目 要 求 不 一 致 。 如 果 想 让 语句 


SET @tax =0 
PRINT ' 低 收入 ' -- 当 条 件 满足 ,显示 “ 低 收入 ” 


作为 一 个 整体 ,在 条 件 成 立 的 时 候 执 行 , 则 会 用 到 BENGIN…END。 用 BEGIN 和 END 
语句 后 的 效果 如 下 。 


DECTARE @inoome int, @tax int 
SET eincome = 8000 
IF eincome <= 3500 
EEGIN 
SET etax =0 
FRINT ' 低 收入 ' -- 当 条 件 满足 ,显示 “ 低 收入 ” 
ED 
IF eincome > 3500 
BESIN 
SET etax = (eincome- 3500) * 0.05 
FRINT ' 工 薪 收 入 ' 
ED 
FRINT @tax 


注意 ,BEGIN 和 END 语句 必须 成 对 使 用 。 任 何 一 条 语句 均 不 能 单独 使 用 。BEGIN 
语句 行 后 为 T-SQL 语句 块 ,最 后 ,END 语句 行 指示 语句 块 结束 。 


4.5.6 IF ELSE 语句 
有 IF 也 有 ELSE 的 IF 语句 的 语法 如 下 。 
正 < 条 件 > 
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< 语句 1 语句 块 > 
ELSE 


< 语句 | 语句 块 才 


当 二 条 件 二 成 立时 ,执行 IF 语句 后 的 语句 或 语句 块 ,然后 控制 跳 到 ELSE 语句 后 的 
语句 或 语句 块 之 后 的 点 ; 当 志 条 件 过 不 成 立时 , 跳 过 IF 语句 后 的 语句 或 语句 块 , 而 执行 
ELSE 语句 后 的 语句 或 语句 块 。 

例如 ,计算 个 税 , 如 果 收 入 小 于 或 等 于 3500 元 ,个 税 为 0, 并 显示 “ 低 收 入 ”; 如 果 收 入 
大 于 3500 元 ,税率 为 5%, 并 显示 “工薪 收入 ”。 完 成 此 计算 的 脚本 为 


DECIARE @inocme int, @tax int 
SET @inccme = 2000 
-- 如 果 收 入 小 于 或 等 于 3500 元 ,个 税 为 0 否则 税率 为 5 . 
IF eincome <=3500 
BEGIN 
SET etax =0 
FRINT ' 低 收入 
END 
ELSE 
BESIN 
SET etax = (@inocme- 3500) * 0.05 
FRINT "工薪 收 入 ' 
ED 
PRINT @tax 


在 此 脚本 中 ,IF 和 ELSE 对 齐 , 其 各 自控 制 的 语句 缩 进 并 对 齐 。 
再 如 ,根据 数值 判断 借贷 方向 : 1 表示 “ 借 ”; 一 1 表示 “ 贷 ”;0 表示 “ 平 ”; 其 他 数值 表 
示 “ 未 知 ”。 完 成 此 计算 的 脚本 为 


DECIARE ef int 
SET @f =1 
IF@f=1 
FRINT ' 借 " 
ELSE 
焉 ef=-1 
FRINT ' 贷 ' 
ELSE 
焉 ef=0 
FRINT 平 ' 


FRINT ' 未 知 ' 
4.5.7 CASE 表达 式 


CASE 具有 两 种 格式 : CASE 简单 表达 式 和 CASE 搜索 表达 式 。CASE 简单 表达 式 
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将 某 个 表达 式 与 一 组 简单 表达 式 进 行 比较 ,以 确定 结果 ;CASE 搜索 表达 式 计算 一 组 布尔 
表达 式 ,以 确定 结果 。 
(1) CASE 简单 表达 式 的 语法 如 下 。 


Cnsg < 测试 表达 式 > 
WHEN < 表达 式 1> THEN < 结果 表达 式 了 
WHEN < 表达 式 2> THEN < 结果 表达 式 全 


WHEN < 表达 式 n> THEN < 结果 表达 式 n> 
[ELSE < 结果 表达 式 nt 1] 
END 


执行 时 , 先 计算 测试 表达 式 , 然 后 按 从 上 到 下 的 顺序 对 每 个 WHEN 子 句 的 表达 式 进行 
计算 。 如 果 某 个 WHEN 子 句 的 表达 式 值 与 测试 表达 式 的 值 相 匹 配 , 则 返回 第 一 个 相 匹 配 的 
WHEN 子 句 的 过 结果 表达 式 二 的 值 。 如 果 没 有 匹配 , 则 当 指定 ELSE 子 句 时 ,SQL Server 
将 返回 二 结果 表达 式 n 十 1 二 的 值 ;车 没有 指定 ELSE 子 句 , 则 返回 NULL 值 。 

例如 ,把 数值 表示 的 借贷 方向 显示 为 汉字 : 1 显示 为 “ 借 ”; 一 1 显示 为 “ 贷 ”;0 显示 为 
“ 平 ”; 其 他 数值 显示 为 “错误 ”。 如 果 使 用 IF 语句 , 则 脚本 为 


DECIARE @flag int 
SET @flag =2 
IF @flag=1 
ERINT ' 借 ' 
ELSE 
IF @flag=-1 
FRINT ' 贷 ' 
ELSE 
IE @flag=0 
FRINT ' 平 ' 
ELSE 
FRINT "错误 ' 


虽然 产生 了 正确 的 结果 ,但 是 这 样 的 程序 使 人 看 起 来 眼花 练 乱 。T-SQL 提供 了 更 加 
简洁 的 表达 方式 ,使 得 程序 更 简单 、 易 懂 。 这 就 是 使 用 CASE 表达 式 : 


-- 若 是 1, 则 显示 " 异 "; 若 是 -1 则 显示 " 贷 " 若 是 0 则 显示 呈 "其 他 ,显示 "错误 " 
DECLARE @flag int, @r nchar (2) 
SET eflag =2 
SET @r— CASE @flag 
WHEN 1THEN 噶 ' 
WHEN -1THEN  ' 贷 ' 
WHEN 0THN  ' 平 " 


HISE "错误 ' 


重 铝 饥 千 雏 舌 血 分册 有 起 不 


注意 ,CASE 要 和 END 配对 出 现 。 
(2) CASE 搜索 表达 式 的 语法 如 下 。 


OSE 
WHEN< 条 件 1> THEN < 结果 表达 式 > 
WHEN< 条件 2> THEN < 结果 表达 式 > 


WHEN < 条 件 n> THEN < 结果 表达 式 n> 
[EISE < 结果 表达 式 nt 1> ] 
END 


执行 时 , 按 从 上 到 下 的 顺序 为 每 个 WHEN 子 名 的 条 件 求 值 ,返回 第 一 个 成 立 的 条 件 
对 应 的 志 结 果 表 达 式 二 的 值 。 如 果 所 有 条 件 都 不 成 立 , 则 当 有 ELSE 子 名 时 ,将 返回 二 结 
果 表 达 式 n 十 1 之 ; 若 没有 指定 ELSE 子 句 , 则 返回 NULL 值 。 

把 数值 表示 的 借贷 方向 转换 为 汉字 的 另 一 个 实现 脚本 如 下 。 


DECLRRE eflag int, @r char(2) 

SET @flag =0 

SET @r= SE 
WHEN @flag =1 THEN " 借 ' 
WHEN eflag=-I1THN ' 贷 ' 
WHEN @flag =0THEN  ' 平 ' 
ELSE "错误 ' 

ED 

print @r 


再 看 一 个 例子 。 空 气 污染 指数 (Air Pollution Index, APD) 是 评估 空气 质量 状况 的 一 
组 数字 , 它 能 告诉 您 今天 或 明天 您 呼吸 的 空气 是 清洁 的 ,还 是 受到 污染 的 ,以 及 您 应 当 注 
意 的 健康 问题 。 空 气 污染 指数 关注 的 是 吸入 受到 污染 的 空气 以 后 几 小 时 或 几 天 内 人 体 健 
康 可 能 受到 的 影响 。 空 气 污染 指数 划分 为 0 一 50.51 一 100.101 一 150、151 一 200、201 一 
300 和 大 于 300 这 6 档 , 对 应 于 空气 质量 的 6 个 级 别 ,指数 越 大 ,级 别 越 高 ,说明 污染 越 严 
重 , 对 人 体 健康 的 影响 也 越 明 显 。 任 意 给 定 一 个 指数 , 试 设计 脚本 ,计算 其 属于 哪 一 档 。 
(1) 使 用 IF 语句 的 脚本 为 


-- 输 入 空气 污染 指数 ,输出 其 所 属 的 级 别 (~ 6) 

DECTRRE @api int, @level int 

SET @api =30 

JF @api >=0 AND @api <=50 
SET @level =1 

下 eapi >=51 AND @api <=100 
SET @level =2 

IE eapi >=101 AND eapi <=150 
SET @level =3 

IE eapi >=151 AND eapi <=200 
SET @level =4 
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正 @api >=201 RND eapi <=300 
SET @level =5 
IF eapi >=301 
SET @level =6 
FRINT cast (elevel AS nchar (1)) +' 级 污染 


(2) 使 用 CASE 表达 式 的 脚本 为 


DECTRRE eapi int, @level int 

SET eapi = 300 

SET elevel = CRSE 
WEEN Qapi >=0 AND eapi <= 50 THEN 1 
WEEN Qapi >=51 AND eapi <=100 THEN 2 
WEEN Qapi >=101 AND eapi <=150 THEN 3 
WEEN Qapi >=151 AND eapi <=200 THEN 4 
WEEN eapi >=201 AND eapi <=300 THEN 5 
WHEN eapi >=301 THEN 6 

END 


PRINT cast (elevel AS nchar (1)) + ' 级 污染 ' 


下 面 例子 的 应 用 较为 广泛 。 在 会 计 信息 系统 中 ,常见 的 金额 结构 有 借方 金额 十 贷方 
金额 ,借贷 方向 十 金额 , 带 正 负 号 的 金额 。 审 计 实 践 中 常 把 后 两 种 方式 转换 为 第 一 种 。 例 


如 ,将 “借贷 方向 十 金额 "方式 的 表 


源 凭 证 号 科目 代码 科目 名 称 借贷 方向 金额 /元 
2013-3-31- 记 -41 102 银行 存款 借 720 
2013-3-31- 记 -41 40501 事业 收入 贷 720 
2013-3-31- 记 -41 51201 事业 税金 借 39.6 
2013-3-31- 记 -41 21002 应 交 营 业 税 贷 36 
2013-3-31- 记 -41 21003 应 交 城 建 税 贷 2.52 
2013-3-31- 记 -41 20703 教育 费 附加 贷 1.08 

转换 为 

源 凭证 号 科目 代码 科目 名 称 借方 金额 /元 贷方 金额 /元 
2013-3-31- 记 -41 102 银行 存款 720 
2013-3-31- 记 -41 40501 事业 收入 720 
2013-3-31- 记 -41 51201 事业 税金 39.6 
2013-3-31- 记 -41 21002 应 交 营 业 税 36 
2013-3-31- 记 -41 21003 应 交 城 建 税 2 
2013-3-31- 记 -41 20703 教育 费 附加 1.08 


EE 


可 设计 脚本 为 
SEIECT 源 凭证 号 ,科目 代码 , 科目 名 称 case 
WEN 借贷 方向 = ' 借 ' then 金额 
ETSE pull 
ED as 借方 金额 ， 
CnsE 
WEN 借贷 方向 = ' 贷 ' then 金额 
ETSE nul1 
END AS 贷方 金额 
INmo 借贷 凭证 表 
FROM 凭证 表 


也 可 以 使 用 如 下 脚本 。 


SETEcT 凭证 号 ,科目 代码 ,科目 名 称 ,借方 金额 =casE 
WEN 借贷 方向 = ' 借 ' then 金额 
ELSE null 
ED, 
贷方 金额 = CRSE 
WEN 借贷 方向 = ' 贷 ' then 金额 
ELSE null 
END 
INIO 借贷 凭证 表 
FROM 凭证 表 


把 带 正 负 号 的 金额 结构 转换 成 借贷 格式 的 结构 : 


源 凭证 号 科目 代码 科目 名 称 金额 /元 
2013-3-31- 记 -41 102 银行 存款 720 
2013-3-31- 记 -41 40501 事业 收入 一 720 
2013-3-31- 记 -41 51201 事业 税金 39.6 
2013-3-31- 记 -41 21002 应 交 营业 税 一 36 
2013-3-31- 记 -41 21003 应 交 城 建 税 一 为 吧 
2013-3-31- 记 -41 20703 教育 费 附加 = 

可 使 用 脚本 : 
SEIECT 凭证 号 ,科目 代码 , 科目 名 称 , 借方 金额 = CnsE 
WEN 金额 >0 then 金额 
ELSE null 
ED, 
贷方 金额 =casE 


WEN 金额 <0 then abs 金额) 
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ELSE null 


4.5.8 WHILE 语句 


例如 ,设计 脚本 ,计算 1 十 2 十 3 十 … 十 10 的 结果 。 可 以 考虑 声明 一 个 存放 结果 的 存储 
单元 @sum, 把 各 个 数 逐 个 累加 上 去 。 脚 本 如 下 。 


DECIAFE @sum int 

SET @sum=0 

SET @sum=@sm+1 
SET @sum=@sum+2 
SET @sum=@sum+3 
SET @sum=@sum+4 
SET @sum=@sm+5 
SET @sum=@sum+6 
SET @sm=@sm+7 
SET @sum=@sum+8 
SET @sum=@sum+9 
SET @sum=@sum + 10 
ERINT @sum 


图 4-8 展示 了 随 着 语句 的 逐条 执行 ,变量 @sum 的 内 容 变 化 。 
SET@sum =0 
SET @sum = @sum+1 
SET @sum = @sum +2 


SET @sum = @sum +3 


SET @sum = @sum + 4 


> 


SET @sum = @sum +5 


己 
四 


SET @sum = @sum +6 


SET @sum = @sum +7 


加 


SET @sum = @sum +8 


w 
on 


加 加 网 避 加 网 网 网 国 加 


SET @sum = @sum +9 


A 


SET @sum = @sum + 10 5 
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可 以 看 到 ,对 1,2,3,…,10 进行 加 法 的 10 条 语句 非常 相似 。 自 然 也 可 以 想到 ,如 果 
加 到 100, 甚 至 加 到 1000, 这 样 的 程序 设计 将 不 现实 。 根 据 语 句 的 相似 性 ,可 以 设计 如 下 
语句 块 , 让 其 反复 执行 : 


SET Gsm =@sum + @i 
让 @i 的 值 从 1 变化 到 10。 从 其 变化 规律 看 ,每 次 @i 增 1 即 可 。 


SET @sum=@sum +@i 
SET @i =@i+1 


但 是 ,注意 一 个 问题 : 当 第 一 次 执行 该 语句 块 时 ,@sum 和 @i 的 值 是 多 少 ? 所 以 ,在 
反复 执行 之 前 ,必须 清楚 @sum 和 @i 的 初 值 。 


SET esm=0 
SET @i=1 


还 有 一 个 问题 : 重复 执行 语句 块 多 少 次 ? 也 就 是 说 , 何 时 停止 重复 执行 ? 对 于 本 例 
而 言 , 希 望 其 在 @i 二 10 时 停止 执行 , 即 在 满足 条 件 @i 二 二 10 时 要 重复 执行 。 

总 而 言 之 ,希望 这 样 解决 问题 : 设置 @sum 的 初 值 为 0; 设置 @i 的 初 值 为 1, 当 满足 
条 件 @i 二 二 10 时 ,要 重复 执行 如 下 语句 块 。 


SET @sum=@sum +@i 
SET @i=@i+1 


这 种 情况 可 使 用 T-SQL 的 WHILE 语句 实现 。 


DECLAFE @i int, @sum int 
SET @sum=0 
SET @i=1 
WHILE @i <=10 
BEGIN 
SET @sum =@sum +@i 
SET @i=@i+1 
END 


图 4-9 展示 了 随 着 语句 块 的 重复 执行 ,变量 @sum 和 @i 的 内 容 变 化 过 程 。 
可 以 再 添加 语句 ,将 结果 显示 在 屏幕 上 。 
再 如 ,设计 脚本 ,计算 1 十 3 十 5… 十 99 的 结果 。 脚 本 如 下 。 


DECLARE @i int, @sum int 
SET @i=1 
SET @sm=0 
WHIE @i <=99 
BEGIN 
SET @sum=@sum +@i 
SET @i =@i+2 
END 
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@sum @i 
SET @sum =0 0 
1 

SET @i=1 

1 
SET @sum = @sum + @i 2 
SET @i= @i+1 
SET @sum = @sum + @i 3 一 一 
SET @i= @i+1 
SET @sum = @sum + @i 6 
SET @i= @i+1 a 
SET @sum = @sum + @i 10 [5 | 
SET @i= @i+1 
SET @sum = @sum + @i 15 
SET @i= @i+1 3 
SET @sum = @sum +6 21 
SET @i= @i+1 7 
SET @sum = @sum + 7 28 
ET @i= @i+1 8 
SET @sum = @sum +8 36 
SET @i= @i+1 9 
SET @sum = @sum +9 45 
SET @i= @i+1 10 
SET @sum = @sum + 10 55 
SET @i= @i+1 

Say 11 


图 4-9 变量 @sum 和 @i 的 内 容 变 化 过 程 


PRINT esum 


BREAK 或 CONTINUE 语句 通常 与 WHILE 同时 使 用 。BREAK 语句 立即 退出 其 
所 在 的 WHILE 循环 ,CONTINUE 语句 立即 执行 下 次 的 WHILE 循环 。 
例如 ,下 面 的 脚本 使 用 BREAK 从 0 累加 到 50 。 


TECIARE @i int, @sum int 
SET ei =0 
SET esm=0 
WHITE @i <100 
BEGIN 

SET @i =@i +1 
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SET @sum=@sum+@i 
IF@i=50 BPREAK 
ED 


FRINT @sum 
下 面 的 脚本 寻找 i 为 多 大 时 ,累加 和 开始 大 于 500。 


DECIARE @i int, @sum int 
SET @i=0 
SET esm=0 
WHITE @i < 100 
BEGIN 

SET @i =@i+1 

SET @sum =@sum + @i 

IF @sun> 500 
BREAK 

ED 
FRINT str(@sum) + ',' +str(@i) 


下 面 的 脚本 实现 从 1 累加 到 100, 但 跳 过 50。 


DECIARE @i int, @sum int 

SET @i=0 

SET @sum=0 

WHILE @i < 100 

BEGIN 
SET @i=@i+1l 

IF@i=50 
CONTINUE 
SET esum= @sum +@i 
END 
PRINT @sum 


T-SQL 部 分 常用 控制 流 关 键 字 见 表 4-1。 
表 4-1 T-SQL 部 分 常用 控制 流 关键 字 


关 键 字 描 述 
IF…ELSE 定义 条 件 以 及 当 条 件 为 TRUE 或 FALSE 时 的 操作 
BEGIN…END 定义 语句 块 
WHILE 当 特 定 条 件 为 TRUE 时 重复 执行 循环 体 中 的 语句 
BREAK 立即 退出 所 在 层 的 WHILE 循环 
CONTINUE 跳 过 循环 体 后 的 语句 ,立即 进行 下 次 的 WHILE 循环 
CASE 根据 条 件 列表 返回 多 个 可 能 结果 之 一 的 表达 式 
RETURN 无 条 件 退 出 


审 动 分 析 : 从 基色 到 大 数据 


IF 语句 和 WHILE 语句 中 都 需要 指定 条 件 , WHERE 子 句 中 也 需要 指定 条 件 , 二 者 
使 用 场合 不 同 。IF 语句 和 WHILE 语句 在 T-SQL 程序 中 实现 流程 控制 ;而 WHERE 子 
句 仅 作为 SELECT 语句 的 一 部 分 使 用 。 


4.6 存储 过 程 


存储 过 程 是 命名 的 T-SQL 语句 的 集合 ,该 对 象 在 数据 库 中 存储 并 作为 独立 单元 被 处 
理 和 在 程序 中 使 用 。 

SQL Server 数据 库 中 有 两 种 存储 过 程 : 系统 存储 过 程 和 用 户 自 定义 存储 过 程 。 
4.6.1 系统 存储 过 程 


系统 存储 过 程 是 一 组 SQL Server 提供 的 存储 过 程 , 可 用 于 执行 一 些 操作 ,如 从 系统 
目录 检索 信息 或 执行 管理 任务 。 系 统 存储 过 程 在 master 数据 库 中 创建 并 存储 , 带 有 sp_ 
前 缀 。 可 从 任何 数据 库 中 执行 系统 存储 过 程 。 下 面 是 一 些 常见 系统 存储 过 程 的 介绍 。 
使 用 系统 存储 过 程 sp_helpdb 显示 服务 器 中 的 所 有 数据 库 及 其 属性 。 


EXEC ap helpdb 


使 用 系统 存储 过 程 sp_helpdb 显示 服务 器 中 的 “东山 县 医院 财务 库 ? 数 据 库 及 其 
属性 。 


Pac ap helpdb 东山 县 医院 财务 库 

使 用 系统 存储 过 程 sp_help 显示 数据 库 中 的 所 有 对 象 信息 。 

EEC sp help 

使 用 系统 存储 过 程 sp_help 显示 东山 县 医院 业务 库 中 的 医生 表 对 象 信息 。 

EXEC sp_help 医生 

使 用 存储 过 程 sp_attach_db 将 “东山 县 医院 业务 库 ” 数 据 库 加 载 到 SQL Server 中 。 
EXEC sp_attach_db @dbname= ' 东 山 县 医院 业务 库 ',@filenamel= 'd:\data\ 东 山 县 医院 业务 库 -maf' 
使 用 系统 存储 过 程 sp_renamedb 重 命名 数据 库 。 

Exmc sp_renamedb ' 东 山 县 医院 '，' 东 山 县 医院 财务 库 ' 


4.6.2 用户 自 定义 存储 过 程 


实践 中 通常 把 完成 特定 功能 的 ,经 常 使 用 的 一 段 代码 定义 为 存储 过 程 使 用 。 

要 编写 自己 的 存储 过 程 ,例如 实践 中 经 常用 到 的 计算 个 人 所 得 税 的 程序 ,那么 就 可 以 
在 查询 编辑 器 中 将 该 程序 定义 为 存储 过 程 ,如 图 4-10 所 示 。 

创建 存储 过 程 的 语句 是 CREATE PROCEDURE。 后 面 的 tax 是 存储 过 程 的 名 字 。 

第 二 行 的 “@S DECIMAL(7,2)” 声 明了 存储 过 程 的 参数 。 
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BEGIN 和 END 括 起 来 的 脚本 为 存储 过 程 体 ,完成 计算 功能 。 


CREATE PROCEDURE tax 存储 过 程 的 名 字 
@S DECIMAL(7,2) 
ns 一 存储 过 程 的 参数 声明 


BEGIN 
DECLARE @T AS DECIMAL(7,2) 


IF @5<=3500 SET @T =0 生理 本 . 守 | 
IF @S >35005ET ersesaamos| 人 全 和 人 全 生 信 
PRINT @T 


END 


4-10 存储 过 程 的 组 成 


存储 过 程 创 建成 功 后 ,可 以 在 SQL 编辑 器 中 通过 EXEC 调用 ,如 : 
EXEC tax 1800 


tax 1800 的 意思 是 以 1800 作为 参数 ,调用 存储 过 程 tax。“ 调 用 ”的 含义 是 首先 把 
1800 赋值 给 @S, 然 后 让 SQL Server 转 去 执行 存储 过 程 体 中 的 程序 。 

存储 过 程 创 建成 功 后 ,在 对象 资 源 管理 器 "中 右 击 “存储 过 程 "组 ,选择 “刷新 ”, 就 会 
看 到 该 存储 过 程 。 

如 果 修 改 存储 过 程 的 定义 ,可 以 在 管理 器 中 右 击 存储 过 程 名 ,在 弹出 的 快捷 菜单 中 选 
择 “ 修 改 ” 选 项 ,查看 并 修改 过 程 体 。 

再 如 ,设计 存储 过 程 .根据 部 门 号 显示 该 部 门 的 门诊 收费 总 和 。 


CREATE, PROCEDURE BuMenShouFei @hrh varchar (10) 
RS 

SEIECT SOM 人 单价 * 数量 ) as 部 门 收费 总 额 

FRCM 门诊 收费 明细 

WHERE 门诊 流水 号 in (SETPcT 门诊 流水 号 FROM 门诊 收费 WHERE 部 门 号 =@brh) 


上 述 存 储 过 程 创 建成 功 后 ,在 查询 编辑 器 中 可 以 调用 该 存储 过 程 .计算 10201 部 门 的 
门诊 收费 总 和 。 


ExEC BMenShouFei "10201' 


4.7 自 定义 函数 


T-SQL 中 提供 了 left() 等 内 置 函 数 。 这 些 函 数 可 以 在 SQL 中 直接 使 用 。 除 了 使 用 
系统 提供 的 函数 外 ,审计 人 员 还 可 以 根据 需要 自 定义 函数 。 函 数 是 SQL Server 中 的 数据 
库 对 象 。 用 户 自 定义 函数 是 存储 在 数据 库 中 的 一 段 T-SQL 程序 ,可 以 被 调用 和 返回 值 。 
用 户 自 定义 函数 不 能 用 于 执行 一 系列 改变 数据 库 状态 的 操作 ,但 它 可 以 像 系统 函数 一 样 
在 查询 或 存储 过 程 等 的 程序 段 中 使 用 。 

例如 ,创建 函数 ,用 来 简单 计算 个 人 所 得 税 。 

可 按 以 下 步骤 在 管理 器 中 创建 函数 。 


围 团 分 秆 : 网 的 国 到 内 区 吉 


第 一 步 ,在 对 象 资源 管理 器 中 展开 “东山 县 医院 业务 库 ”, 继 续 展 开 “ 可 编程 性 ”, 然 后 在 
“函数 "上 右 击 ,在 弹出 的 快捷 菜单 中 选择 “新 建 ”, 然 后 选择 “标量 值 函 数 ”, 如 图 4-11 所 示 。 


图 4-11 新 建 函 数 


第 二 步 ,在 为 “新 建 函 数 ” 打 开 的 SQL 编辑 器 中 ,如 图 4-12 所 示 , 把 自动 生成 的 程序 
模板 删除 ,根据 需要 定义 函数 的 名 称 、 参 数 以 及 函数 体 如 下 。 


CREATE FUNCTION gsh (@S TECIMAL(7,2)) 
RETURNS DECIMAL (7, 2) 
PS 
BEGIN 
DECLARE @T RS DECIMAL(7,2) 
IF @S<=3500 SET @T =0 
IE 6S > 3500 SET @T= (@S - 3500) * 0.05 
RETURN 6T 
ED 


-- Create date: <Create Date, ,> 


sname, FunctionName> 


【 
-- Add the parameters for the function here 
<BPparaml, sysname, Bpi> <Data Type_For_Paraml, , int> 
) 
RETURNS <Function Data Type, ,int> 
15 
BEGIN 
-- Declare the return variable here 
DECLARE <BResultVar, sysname, BResult> <Function Data Type, ,int> 


-- Add the T-SQL statements to compute the return Value here 
SELECT <BResultVar, sysname, BResult> = <BParaml, sysname, Bpl> 


~- Return the result of the function 
RETURN <BResultVar, sysname, BResult> 


END 
Go 


4-12 ”函数 体 
第 三 步 , 写 好 后 , 单 击 “分 析 ? 按 钮 进行 检查 ,如 果 无 误 , 则 单 击 * 执 行 ? 按 钮 ,函数 创建 
成 功 。 
函数 创建 成 功 后 ,在 “对 象 资源 管理 器 ”中 右 击 “函数 ”组 ,选择 “刷新 ”, 就 会 在 “标量 值 
函数 "组 中 看 到 该 函数 。 


蕴 网 向 同名 固有 分 入 起 站 


在 该 函数 定义 中 ,各 个 组 成 部 分 的 含义 如 图 4-13 所 示 。 


Fe] 形式 参数 声明 ] 
CREATE FUNCTION gsh (@S IMAL(7,2)) 


RETURNS DECIMAL(7,2) 一 声明 函数 的 返回 值 类 型 
As 
完成 计算 ] ”EGR 声明 函数 中 使 用 的 局 部 变量 
DECLARE @T AS DECIMAL(7,2) 


IF @S<=3500 SET @T=0 
IF@S >3500 SET @T= (@S-3500)*0.05 


sa 
加 返回 计算 结果 
图 4-13 ”函数 的 组 成 


在 当前 数据 库 上 新 建 查询 ,在 打开 的 SQL 编辑 器 中 使 用 如 下 查询 调用 该 函数 。 


SELECT dbo.gsh (1200) 


这 里 ,gsh(1200) 称 为 函数 调用 。 当 发 生 函 数 调用 时 ,首先 把 实在 参数 1200 赋值 给 形 
式 参 数 @S, 然 后 让 SQL Server 转 去 执行 完成 计算 的 函数 体 ( 即 图 4-13 中 BEGIN END 
括 起 来 的 阴影 部 分 )。 函 数 体 中 的 最 后 一 条 语句 是 RETURN @T, 该 语句 把 变量 @T 中 
存放 的 计算 结果 返回 到 函数 调用 位 置 ,所 以 在 select gsh(1200) 语句 执行 时 ,首先 计算 
gsh(1200) 得 到 结果 0, 然 后 把 0 显示 出 来 。 这 就 好 比 是 select 1 十 2 首先 计算 1 十 2, 然 后 
显示 表达 式 1 十 2 的 结果 3 一 样 。 

若 要 修改 和 删除 用 户 自 定义 函数 ,那么 在 管理 器 中 选择 要 修改 的 用 户 自 定义 函数 , 右 
击 , 从 弹出 的 快捷 菜单 中 选择 “修改 ”选项 , 则 会 出 现 * 用 户 自 定义 函数 ”对 话 框 。 在 其 中 可 
以 修改 用 户 自 定义 函数 的 函数 体 、 参 数 等 。 从 弹出 的 菜单 中 选择 “删除 ”选项 , 则 删除 用 户 
自 定义 函数 。 

车 要 查看 用 户 定义 的 函数 , 则 使 用 命令 : 


sp help gsh 


也 可 以 直接 使 用 CREATE FUNCTION 创建 函数 。 例 如 ,定义 计算 1 一 12 月 中 某 月 
个 人 所 得 税 的 函数 的 语句 如 下 。 


/* 功能 :计算 1 一 12 月 的 应 交 所 得 税 函 数 
* 输入 :个 人 月 收入 

* 返 回 值 :月 个 人 计 税 总 额 

#*/ 

CREATE, FUNCTION geShui (@incame money) 
RETURNS money 


二 却 分 村 : 风 的 国 到 大 二 乓 


when @incame— 3500> 0 and eincome- 3500<= 500 then (eincomer 3500) * 0.05 
when @incame— 3500> 500 and eincomer 3500< = 2000 then 
(Gincome- 3500) * 0.1- 25 
when @incame— 3500> 2000 and eincomer 3500< = 5000 then 
(eincome- 3500) * 0.15- 125 
when 8@income- 3500> 5000 and @inocme- 3500< = 20000 then 
(@incame— 3500) * 0.2- 375 
when @incame— 3500> 20000 and Ginccme - 3500< = 40000 
then (@incame— 3500) * 0.25- 1375 
else null 
END 
RETURN @T 
ED 


假设 收入 为 2500, 则 计算 个 税 的 语句 为 
SEIECT geShui (2500) 
假设 在 表 TEST 中 有 “月 收入 ” 列 : 


CREATE TABLE # TEST 月 收入 money) 
INSERT INTO # TEST VALUES (3000) 
INSERT INTO# TEST VALUES (8000) 


可 在 表 上 直接 计算 个 税 : 


SEIECT 月 收入 , geshui 上 朋 收 入 ) as 个 人 所 得 税 
ERCM # TEST 


此 例 的 另外 一 种 脚本 是 直接 使 用 RETURN 返回 计算 结果 : 


CREATE FUNCTION geShui (@x money) 
RETURNS money 


PS 

BEGIN 

RETURN CASE 
when @x<= 3500 then 0 
when @x- 3500> 0 and @x- 3500< = 500 then (@x- 3500) * 0.05 
when @x- 3500> 500 and @x- 3500< = 2000 then (@x- 3500) * 0.1- 25 
when @x- 3500> 2000 and @x- 3500< = 5000 then (@x- 3500) * 0.15- 125 
when @x- 3500> 5000 and @x- 3500< = 20000 then (@x- 3500) * 0.2- 375 
when @x- 3500> 20000 and @x- 3500< = 40000 then (@x- 3500) * 0.25- 1375 
else null 
ED 

END 


注意 ,在 本 例 的 函数 体 中 只 有 一 条 语句 (RETURN) ,该 语句 中 包含 了 一 个 CASE 表 
达 式 (从 CASE 开始 ,到 END 结束 ) 。 
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可 以 在 表达 式 中 使 用 函数 ,而 不 能 在 表达 式 中 使 用 存储 过 程 。 创 建 函 数 的 语法 为 


CREATE FUNCTION 《< 函数 名 > ( [参数 1 数据 类 型 1 ,参数 2 数据 类 型 2 … ] ) 
RETURNS < 返回 值 数据 类 型 > 
RS 
BEGIN 
< 函数 体 > 
RETURN < 表达 式 > 
END 


一 个 函数 最 多 可 以 定义 1024 个 参数 ,每 个 参数 前 用 "@” 符 号 标明 。 参 数 的 作用 范围 
是 整个 函数 。 参 数 只 能 蔡 代 常量 ,不 能 替代 表 名 、 列 名 或 其 他 数据 库 对 象 的 名 称 。 

参数 的 数据 类 型 可 以 为 除 TEXT 、NTEXT、IMAGE、CURSOR TIMESTAMP 和 
TABLE 类 型 外 的 其 他 数据 类 型 。 

二 函数 体 二 是 一 系列 的 T-SQL 语句 ,它们 决定 了 函数 的 功能 。 


4.8 触 发 器 


触发 器 是 一 种 特殊 类 型 的 存储 过 程 , 它 在 指定 的 表 中 的 数据 发 生变 化 时 自动 执行 。 
唤醒 调用 触发 器 ,以 响应 INSERT、UPDATE 或 DELETE 语句 。 触 发 器 可 以 查询 其 他 
表 , 并 可 以 包含 复杂 的 T-SQL 语句 。 和 触发 器 是 审计 数据 修改 的 重要 设施 。 

触发 器 具有 以 下 特点 : 它 是 在 操作 有 效 后 才 执行 的 , 即 其 他 约束 ,如 CHECK 约束 ， 
优先 于 触发 器 ; 它 与 存储 过 程 的 不 同 之 处 在 于 ,存储 过 程 可 以 由 用 户 直接 调用 ,而 触发 器 
不 能 被 直接 调用 ,是 由 事件 触发 的 ;一 个 表 可 以 有 多 个 触发 器 ,在 不 同 表 上 ,同一 种 类 型 的 
触发 器 也 可 以 有 多 个 ;和 触发 器 是 定义 在 行 更 新 语句 上 的 ,该 语句 可 能 影响 多 行 ,SQL 
Server 仅 为 每 个 更 新 语句 触发 ,而 不 是 为 每 一 行 触发 。 

SQL Server 提供 了 两 种 类 型 的 触发 器 : INSTEAD OF 触发 器 和 AFTER 触发 器 。 
两 种 类 型 的 触发 器 比较 见 表 4-2。 


表 4-2 两 种 类 型 的 触发 器 比较 


触 发 器 INSTEAD OF AFTER 
DML 语句 模拟 但 不 执行 执行 ,但 可 以 在 触发 器 中 回 退 
执行 时 机 在 PK 和 FK 约束 前 事务 完成 后 提交 前 (所 有 约束 满足 后 ) 
是 否 可 应 用 于 视图 是 否 
每 个 表 上 可 能 的 事件 三 全 多 个 


当 向 表 中 插入 数据 时 ,所 有 数据 约束 都 通过 之 后 ,INSERT 触发 器 就 会 执行 。 当 对 
表 删 除数 据 时 ,DELETE 触发 器 会 被 执行 。 利 用 UPDATE 修改 一 条 记录 时 ,相当 于 删除 
一 条 记录 ,然后 再 增加 一 条 新 记录 。 

例如 ,在 表 T 上 创建 触发 器 ,使 得 每 插入 一 行 后 ,显示 “ONE ROW IS INSERTED. ”。 
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审 动 分 析 : 从 其 系 到 类 数 揭 


首先 创建 表 T: 
CREATE TABIE T (R INT, B INT) 
然后 在 TT 上 创建 触发 器 : 


CREATE TRIGER TRG insert rows 
CNT 
AFTERINSERT 
RS 
EEGIN 

FRINT 'ONE ROW IS INSERTED." 
END 


现在 测试 该 触发 器 。 在 查询 编辑 嚣 中 输入 插入 语句 : 
INSERT INTO T VALUES (11, 12) 
会 显示 : 


ONE RON IS INSERTED. 

代行 受 影响 ) 

现在 创建 一 个 INSTEAD OF 触发 器 
CEEATE TRIGSER TRG INSTERDOF insert rows 
cNT 

INSTEAD OF INSERT 

RS 

BEGIN 


ERINT 'INSTEAD OF TRIGSER FOR INSERT. 
END 


在 对 象 资源 管理 器 中 右 击 TRG_insert_rows 触发 器 ,从 弹出 的 快捷 菜单 中 选择 “ 禁 
用 ”选项 ,然后 执行 下 面 的 插入 语句 。 


INSERT INTO T VALUES (21, 22) 
显示 结果 如 下 。 


TINSTFAD OF TRIGSER FOR INSERT. 


位 行 受 影响 ) 
使 用 查询 语句 观察 是 否 把 (21,22) 插 入 了 : 


SEIECT 关 
FROMT 


发 现 表 中 仍然 只 有 一 行 ,没有 将 (21.22) 插 入 。 
如 果 在 会 计 科 目 表 上 定义 了 删除 触发 器 TRG_delete_rows: 
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区 网 鲜 局 有 因而 纯 柄 二 呆 


CREATE TRIGSER TRG delete rows 
ou 会 计 科目 表 
FOR TETETE 
RS 
BEESIN 
RAISERROR (' 不 允许 删除 会 计 科目 表 中 的 行 ',11,1) 
FRINT "Hi' 
ED 


然后 执行 删除 语句 ,会 发 现 出 错 消息 : 


服务 器 : 消息 50000, 级 别 11, 状 态 1, 过 程 TRG Gelete rows, 行 7 
不 允许 删除 会 计 科 目 表 中 的 行 
(所 影响 的 行 数 为 0 行 ) 


该 错误 信息 中 包含 了 5 个 部 分 。 

错误 号 : 每 个 错误 消息 都 具有 唯一 的 错误 号 ;约定 用 户 自 定义 消息 的 错误 号 大 
于 50000 。 

严重 性 : 严重 性 指示 错误 的 严重 程度 。 严 重 性 较 低 的 错误 ,如 级 别 0 一 9 ,为 信息 性 消 
息 或 低级 警告 ;严重 级 别 为 11 一 16 的 错误 信息 由 用 户 生 成 ,并 由 用 户 修 正 。 

状态 : 描述 发 生 错 误 时 的 状态 ,对 每 个 引发 错误 的 特定 情况 都 分 配 唯 一 的 状态 代码 
(1 一 127) 。 默 认 值 是 1。 

过 程 名 称 : 出 现 错误 的 存储 过 程 或 触发 器 的 名 称 。 

行 号 : 指示 在 批 处 理 , 存 储 过 程 . 触 发 器 或 函数 中 产生 错误 的 语句 所 在 行 。 

错误 消息 字符 串 : 错误 消息 包含 关于 错误 原因 的 诊断 信息 。 


4.9 游 标 


由 SELECT 语句 返回 的 行 集 包括 所 有 满足 该 语句 WHERE 子 句 中 条 件 的 行 。 由 语 
句 返 回 的 这 一 完整 的 行 集 被 称 为 结果 集 。 

应 用 程序 ,特别 是 交互 式 联机 应 用 程序 ,并 不 总 能 将 整个 结果 集 作为 一 个 单元 有 效 地 
处 理 。 这 些 应 用 程序 需要 一 种 机 制 ,以 便 每 次 处 理 一 行 或 一 部 分 行 。 游 标 就 是 提供 这 种 
机 制 的 结果 集 扩展 。 结 果 集 在 系统 中 的 位 置 如 图 4-14 所 示 。 


查询 编辑 器 


三 结果 集 习 
变量 FETCH 


4-14 结果 集 在 系统 中 的 位 置 
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游标 通过 以 下 方式 扩展 结果 处 理 : 允许 定位 在 结果 集 的 特定 行 ;从 结果 集 的 当前 位 
置 检 索 一 行 或 多 行 ;支持 对 结果 集中 当前 位 置 的 行进 行 数据 修改 。 

使 用 游标 的 一 般 过 程 : 创建 游标 ; @ 打 开 游 标 ; @ 重 复 从 游标 中 提取 (FETCH) 行 
进行 处 理 ,直到 到 达 末 尾 ; @ 关 闭 游标 ; @ 释 放 游 标 。 

例如 ,在 程序 中 逐 行 提取 医生 表 中 的 各 行 ,依次 存 和 程序 变量 中 。 

(1) 创建 游标 。 


TECIARE cur 医生 ”CORSCR 
ECR SEIECT * FROM 医生 


现在 有 了 名 为 “cur_ 医 生 ” 的 游标 ,游标 中 包含 了 医生 表 中 的 所 有 记录 ,但 在 使 用 这 些 
记录 前 , 须 先 打开 游标 。 
(2) 打开 游标 。 


OPEN cur 医生 
-=- "cur 医生 " 呢 游 标 名 称 


(3) 滚动 游标 ,提取 数据 。 
下 面 的 语句 从 游标 中 提取 数据 ,并 放 到 程序 变量 中 。 


TECIARE 6 医生 号 char(30) 

DECLRRE 6 姓名 char(40) 

DECIARE @ 部 门 号 char(20) 

FETCH cur 医生 INIO @ 医 生 号 , 姓名, @ 部 门 号 


可 以 使 用 WHILE 循环 从 游标 中 提取 所 有 记录 ,但 如 何 判 断 到 达 了 游标 的 末尾 ? 全 局 变 
量 @@FETCH_STATUS 记载 最 近 一 次 提取 语句 (FETCH) 的 执行 状态 ,其 取 值 及 含义 如 下 。 


返回 值 ”描述 

0 FETCH 语句 成 功 

-1 FETCH 语 句 失败 或 此 行 不 在 结果 集中 
-2 被 提取 的 行 不 存在 


全 局 变量 @@ROWCOUNT 返回 受 上 一 语句 影响 的 行 数 ,包括 FETCH 。 


DECIARE @ 医 生 号 char (30) 
DECIARE @ 姓 名 char (40) 
DECIARE @ 部 门 号 char (20) 
FETCH cur 医生 INIO”@ 医 生 号 , 8 姓名 , @ 部 门 号 
WHIE (@@FETCH STATUS =0) 
BEGIN 
print @ 医 生 号 
print @ 姓 名 
print @ 部 门 号 
FETCH cur 医生 INIO 8 医生 号 , 姓名, 部 门 号 
END 
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(4) 关闭 游标 。 
CIOSE ”cur 医生 


游标 被 关闭 后 依然 存在 ,以 便 再 次 被 打开 。 当 不 再 使 用 游标 时 ,应 当 释 放 它 。 
(5) 释放 游标 。 


DEALIOCATE cur 医生 


与 表 、 视 图 .索引 、 存 储 过 程 和 触发 器 不 同 ,游标 并 不 是 数据 库 对 象 。 游 标 可 在 3 个 范 
围 内 有 效 。 游 标 在 连接 中 有 效 。 连 接 开始 于 用 户 登录 (log on) ,结束 于 用 户 注销 (log 
off) 。 当 用 户 登录 后 创建 了 游标 , 则 该 游标 在 用 户 注销 后 失效 。 在 存储 过 程 执行 期 间 , 存 
储 过 程 中 定义 的 游标 有 效 。 触 发 器 中 创建 的 游标 仅 在 触发 器 执行 期 间 有 效 。 

下 面 的 例子 演示 如 何 应 用 游标 实现 随机 抽样 。 

为 了 减少 数据 规模 (一 般 限 制 在 50000 行 记录 ) ,降低 审计 风险 ,通常 使 用 的 技术 之 一 
是 随机 抽样 。 

假设 对 “银行 贷款 ”数据 库 中 的 “借款 凭证 表 ” 进 行 10% 随 机 抽样 , 原 表 中 有 114460 
行 。 首 先 在 被 抽样 表 中 增加 行 号 和 随机 数 两 列 ,然后 为 每 一 列 指派 一 个 随机 数 ,接着 按照 
随机 数列 对 所 有 行 排序 ,最 后 从 排序 结果 中 提取 前 10%。 脚 本 如 下 。 


/< 使 用 临时 表 , 以 提高 性 能 * / 
SEIECT * 
INIO# # 被 抽样 表 
FFOM 借 款 凭证 表 
/* 修改 临时 表 的 表 结构 ,以 向 其 中 插入 随机 数 * / 
ALTER TABIE 间 # 被 抽样 表 
RDD 行 号 int, 随机 数 int 
/* 使 用 游标 为 每 一 行 指派 随机 数 * / 
DECLARE @row int; 
DECIARE U_C CURSOR 
FOR SEIECT x FROM ## 被 抽样 表 
FOR UPDATE OF 行 号 ,随机 数 ; 
OFENU C; 
FETCH NEXT FROMU C; 
SET @row = 0; 
WHITE @@FETCH STATUS =0 
EEGIN 
UPDATE ## 被 抽样 表 
SET 行 号 =@row, 随机 数 = cast (floor (rand() * 100000000) RS int) 
WHERE CURRENT OF U_C7 
SET @row = @rowt 1; 
FETCH NEXT FROMU C7 
END 
CIOSEUC 
DEALIOCATEU C 
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/* 从 添加 了 随机 数 的 临时 表 中 选取 10s 作为 抽样 结果 * / 
SELECT top 10 peroent * 
Timo 抽样 表 
EECM## 被 抽样 表 
ORDER BY 随机 数 asc 


也 可 以 使 用 以 下 简单 的 查询 实现 随机 抽样 。 


SETECT top 10 Percent * 
FFCM 借 款 赁 证 表 
ORDER BY newid() 


如 果 Microsoft SQL Server 是 后 面 的 更 高 的 版 本 ,以 下 语句 的 抽样 执行 效率 最 高 。 


SETRCT * 

FROM 借款 凭证 表 

TABLESAMPLE, (10 PERCENT) 

注意 : TABLESAMPLE 是 在 SQL Server 2005 中 引入 的 。 当 TABLESAMPLE 用 
于 从 早期 版 本 升级 的 数据 库 时 ,数据 库 的 兼容 级 别 必须 至 少 设 置 为 90。 设 置 数据 库 兼 容 
级 别 如 图 4-15 所 示 。 


服务 器 : 
IBN-THTNK 


连接 
ibm-THINK\Donald Dong 


事 查 在 连接 图 性 


4-15 设置 数据 库 兼容 级 别 
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使 用 游标 进行 逐个 记录 更 新 时 , 须 选择 SQL 编辑 器 以 文本 方式 显示 结果 ,否则 系统 
会 出 现 “ 资 源 不 足 ” 问 题 。 


4. 10 事务 与 并 发 控制 


在 多 用 户 和 网 络 环境 下 ,数据 库 是 一 个 共享 资源 ,多 个 用 户 或 应 用 程序 同时 对 数据 库 
的 同一 数据 对 象 进行 读 写 操作 ,这 种 现象 称 为 对 数据 库 的 并 发 操作 。 显 然 , 并 发 操作 可 以 
充分 利用 系统 资源 ,提高 系统 效率 。 虽 然 如 此 ,但 是 如 果 对 并 发 操作 不 进行 控制 ,就 会 造 
成 一 些 错误 。 对 并 发 操作 进行 的 控制 称 为 并 发 控制 。 并 发 控制 能 力 是 衡量 一 个 DBMS 
的 重要 性 能 指标 之 一 。 


4.10.1 事务 的 概念 


事务 (transaction) 是 用 户 定义 的 一 个 数据 库 操作 序列 ,这 些 操作 要 么 全 做 ,要 么 全 不 
做 ,是 一 个 不 可 分 割 的 工作 单位 。 例 如 ,银行 转账 的 业务 过 程 是 : 从 1001 账户 划 走 800 
元 到 1002 账户 。 这 笔 业务 对 应 两 个 数据 库 操作 : 1001 账户 减 去 800 元 和 1002 账户 增加 
800 元 。 这 两 个 数据 库 操作 不 可 分 割 。 

在 SQL Server 中 ,事务 的 开始 与 结束 可 以 由 用 户 显 式 定义 。 如 果 用 户 没有 显 式 地 定 
义 事务 , 则 由 DBMS 按 默认 自动 划分 事务 。 在 SQL 中 ,定义 事务 的 语句 有 3 条 : BEGIN 
TRANSACTION .COMMIT TRANSACTION ROLLBACK TRANSACTION 。 

事务 通常 以 BEGIN TRANSACTION 开始 ,以 COMMIT TRANSACTION 或 
ROLLBACK TRANSACTION 结束 。COMMIT 的 作用 是 提交 , 即 提交 事务 的 所 有 操 
作 。 事 务 提交 是 将 事务 中 所 有 对 数据 的 更 新 写 回 到 磁盘 上 的 物理 数据 库 中 ,事务 正常 结 
东 。ROLLBACK 的 作用 是 回 滚 , 即 在 事务 运行 的 过 程 中 发 生 了 某 种 故障 ,事务 不 能 继续 
执行 ,系统 将 事务 中 对 数据 库 的 所 有 已 完成 的 操作 全 部 撤销 , 回 滚 到 事务 开始 时 的 状态 。 

事务 具有 4 个 特性 , 即 原子 性 、 隔 离 性 .一 致 性 和 持续 性 。 

原子 性 (atomicity) : 事务 中 包括 的 诸 操 作 要 么 都 做 ,要 么 都 不 做 。 也 就 是 说 ,事务 作 
为 一 个 整体 单位 被 处 理 ,不 可 以 被 分 割 。 

隔离 性 (isolation) : 一 个 事务 的 执行 不 能 被 其 他 事务 干扰 , 即 一 个 事务 内 部 的 操作 及 
使 用 的 数据 对 其 他 并 发 事务 是 隔离 的 ,并 发 执行 的 各 个 事务 之 间 不 能 互相 干扰 。 

一 致 性 (consistency) : 事务 执行 的 结果 必须 使 数据 库 处 于 一 个 一 致 性 状态 。 当 数据 
库 中 只 包含 成 功 事务 提交 的 结果 时 ,就 说 数据 库 处 于 一 致 性 状态 。 如 果 数 据 库 系统 运行 
中 发 生 故 障 , 有 些 事务 尚未 完成 就 被 迫 中 断 ,这 些 未 完成 事务 对 数据 库 所 做 的 修改 有 一 部 
分 已 写 人 物理 数据 库 , 这 时 数据 库 就 处 于 一 种 不 正确 的 状态 或 者 说 是 不 一 致 状态 ,数据 
库 系统 必须 确保 事务 的 一 致 性 。 

持续 性 (durability) : 也 称 永 久 性 (permanence) 。 持 续 性 指 一 个 事务 一 旦 提交 , 它 对 
数据 库 中 数据 的 改变 就 是 永久 性 的 , 接 下 来 的 其 他 操作 或 故障 不 应 该 对 其 执行 结果 有 任 
何 影响 。 
事务 的 这 些 特性 由 数据 库 管理 系统 中 的 并 发 控制 机 制 和 恢复 机 制 保障 。 
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4.10.2 事务 类 型 


SQL Server 的 每 一 个 连接 可 以 使 用 它们 需要 的 事务 模式 实现 它们 的 需求 : 自动 提 
交 事务 、 显 式 事务 和 隐 式 事务 。 

由 SQL Server 定义 的 事务 称 作 自动 提交 事务 。SQL Server 将 一 切 都 作为 事务 处 
理 。 用 户 没有 定义 事务 ,SQL Server 会 自己 定义 事务 。 例 如 : 

假设 存放 账户 的 表 account 的 结构 如 下 。 


列 名 ”类 型 
账户 char(4) 
金额 int 


创建 该 表 的 SQL 语句 如 下 。 
CREAT table account (账户 char (4), 金额 int CHECK (金额 >=0) ) 


表 中 的 数据 如 下 。 


账 户 金额 /元 账 户 金额 /元 
1001 700 1002 2600 


而 且 在 金额 列 上 具有 CHECK 约束 : 金额 之 一 0。 
那么 ,完成 从 1001 账户 到 1002 账户 转账 800 元 事务 的 SQL 语句 是 : 


-- 操 作 1: 从 1001 账 户 上 减 800 元 
UPDATE account 
SET 金额 = 金额 - 800 
WHERE 账户 = '1001" 
-- 操 作 2: 从 1002 账 户 上 加 800 元 
UPDATE account 
SET 金额 = 金额 + 800 
WEERE 账户 = '1002" 
-- 操 作 3: 查 看 结果 
SETECT * 
ERCM account 
在 SQL 查询 分 析 器 中 打开 “查询 ”菜单 ,选择 “文本 显示 结果 ”。 在 显示 结果 窗 格 会 看 
到 第 一 个 操作 没有 成 功 , 因 为 700 一 800 后 账户 金额 小 于 0, 违反 了 该 表 上 的 CHECK 约 
东 。 但 是 ,第 二 个 操作 和 第 三 个 操作 被 成 功 完 成 。SQL Server 使 用 自动 提交 事务 时 ,每 一 
个 语句 本 身 是 一 个 事务 。 如 果 这 个 语句 产生 了 错误 , 它 的 事务 会 自动 回 滚 。 如 果 这 个 语 
句 成 功 执行 而 没有 产生 错误 , 它 的 事务 会 自动 提交 。 因 此 .第 二 个 和 第 三 个 操作 将 被 提 
交 , 而 第 一 个 有 错误 的 操作 会 回 滚 。 
在 显 式 事务 中 ,用 户 要 定义 一 个 事务 在 何 处 开始 ,并 定义 这 个 事务 在 什么 时 候 需 要 提 
交 或 回 滚 。 这 通过 T-SQL 语句 BEGIN TRANSACTION COMMIT TRANSACTION 
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和 ROLLBACK TRANSACTION 实现 。 

现在 希望 将 3 个 操作 要 么 都 完成 ,要 么 一 个 也 不 做 。 因 此 需要 将 各 操作 组 织 在 一 个 
显 式 事务 中 ,而 且 指 明 若 其 中 任意 一 个 操作 发 生意 外 ,就 回 退 全 部 操作 (整个 事务 ) 。 在 查 
询 窗口 中 输入 以 下 语句 并 一 次 执行 所 有 语句 。 


-- 下 面 定义 错误 出 现 后 回 退 事 务 ,约束 3 条 语句 要 么 全 做 ,要 么 全 不 做 
DECTARE @EACK int 
SET EBPCK = 0 
BEGIN TRAN 
-- 操 作 1: 从 1001 账户 上 减 800 元 
UPDATE account 
SET 金额 = 金额 -800 
WHERE 账户 = '1001" 
IF eeERRCR <>0 
SET @BRCK =1 
-= 操作 2: 从 1002 账 户 上 加 800 元 
UEDATF account 
SET 金额 = 金额 + 800 
WHERE 账户 = '1002" 
IE eeEFROR <>0 
SET @BRCK = 1 
-- 操 作 3: 查 看 结果 
SEIECT * 
FROM account 
IE eeERRCR <>0 
SET CEAK =1 
IF @BAK =1 
EEGIN 
-- 若 3 条 语句 其 中 之 一 失败 ,就 回 退 事务 
PRINT ' 回 退 事务 ' 
ROLTPACK TRAN 
END 
ELSE 
EEGIN 
--3 条 语句 均 成 功 , 提 交 事务 
COMMIT TRAN 
ED 


当 SQL Server 完成 T-SQL 语句 的 执行 时 ,如 果 语 句 执行 成 功 , 则 @@ERROR 设置 
为 0。 若 出 现 一 个 错误 , 则 返回 一 条 错误 信息 。@@ERROR 返回 此 错误 信息 代码 ,直到 
另 一 条 T-SQL 语句 被 执行 。 可 以 在 sysmessages 系统 表 中 查看 与 @@ERROR 错误 代码 
相关 的 文本 信息 。 

由 于 @@ERROR 在 每 一 条 语句 执行 后 被 清除 并 且 重 置 , 所 以 应 在 语句 验证 后 立即 
检查 它 ,或 将 其 保存 到 一 个 局 部 变量 中 .以 备 事后 查看 。 
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FFOM account 


可 以 看 出 ,整个 事务 都 回 滚 了 。 

上 例 中 通过 在 创建 表 时 ,对 金额 做 了 “二 一 0" 的 CHECK 限制 ,这 样 就 可 以 通过 全 局 
变量 @@ERROR 判断 SQL 语句 是 否 出 错 ,进而 判断 事务 是 否 应 该 提交 或 者 回 深 。 如 果 
上 例 中 金额 一 列 并 没有 该 CHECK 限制 , 那 就 不 能 通过 @@ERROR 变量 判断 了 。 在 这 
种 情况 下 ,可 以 直接 在 SQL 语句 中 自己 判断 账户 余额 是 否 小 于 0。 


BEGIN TRAN 
-- 操 作 1: 从 1001 账户 上 减 800 元 
UPDATE account 
SET 金额 = 金额 -800 
WHERE 账户 = '1001" 
下 (SELECT 金额 FROM account WHERE 账户 = "1001')<0 
BEGIN 
FRINT ' 回 退 事务 ' 
FOLTBACK TRAN 
ED 
ELSE 
EEGIN 
-- 操 作 2: 从 1002 账 户 上 加 800 元 
UPDATE account 
SET 金额 = 金额 + 800 
WHERE 账户 = '1002" 
CMMIT TRAN 
ED 
-- 操 作 3: 查 看 结果 
SETECT * 
FROM account 


第 3 种 模式 称 作 隐 式 事务 模式 。 因 为 在 这 种 模式 中 ,SQL Server 在 没有 事务 存在 的 情 
况 下 会 开始 一 个 事务 ,但 不 会 像 在 自动 模式 中 那样 自动 执行 COMMIT 或 ROLLBACK 语 
句 。 事 务必 须 显 式 结束 。 以 下 语句 隐 式 开始 一 个 事务 : ALTER TABLE .GRANT FETCH、 
DELETE CREATE .REVOKE INSERT、SELECT、.DROP、.OPEN UPDATE 、TRUNCATE 
TABLE 。 

设置 连接 为 隐 式 事务 模式 的 语句 为 


SET IMPLICIT _ TRANSACTIONS CN 


可 用 @@TRANCOUNT 测试 是 否 已 经 打开 一 个 事务 。 测 试 方案 如 下 : 在 创建 表 前 
先 查 询 活动 事务 数 , 然 后 创建 表 ; 再 查询 活动 事务 数 ;然后 做 一 条 插入 语句 ;再 查询 活动 事 
务 数 ;最 后 关闭 隐 式 事务 。 
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-查询 活动 事务 数 ,此 时 为 0。 该 语句 测试 当前 连接 的 活动 事务 数 
-- 结 果 是 1 的 意思 是 当前 连接 已 经 打开 了 一 个 事务 ;结果 是 0 的 意思 是 当前 没有 事务 
SETECT @@TRANOOUNT 
-创建 表 , 开 始 一 个 隐 式 事务 
CREATE TABIE T1 (ID int FRIMARY KEY) 
-- 再 次 测试 当前 连接 的 活动 事务 数 ,结果 是 1 
SETPCT eeTRRNOOUNT 
INSERT INTO mL VALUES (5) 
-- 再 次 测试 当前 连接 的 活动 事务 数 ,结果 是 1, 由 于 已 经 有 一 个 打开 的 事务 ,因此 sr server 没 有 开 
始 一 个 新 的 事务 
SETRCT eeTRRNOOUNT RS [Transaction Count] 
=- -执行 以 下 语句 回 滚 这 个 事务 ,并 再 次 检查 eeTRaNcoNT。 可 以 看 出 ,在 ROLLBRCK TRAN 语句 执行 之 
后 ,eeTRANCOONT 的 值 变 成 了 0 
ROLIBRCK TRAN 
SELECT eeTRRNOOUNT 
=-- 执 行 以 下 代码 关闭 隐 式 事务 


SET JIMELICIT TRANSACTIONS OFF 


由 于 没有 显 式 的 BEGIN TRANSACTION 语句 ,提交 或 回 滚 步骤 很 容易 被 忘记 , 导 
致 事务 长 期 运行 ,或 在 连接 关闭 时 产生 不 必要 的 回 滚 ,以 及 与 其 他 连接 之 间 产 生 阻 塞 
问题 。 


4.10.3 并 发 操作 可 能 产生 的 问题 
假设 存放 账户 的 表 account 的 结构 如 下 。 


列 名 ”类 型 

账户 char(4) 
金额 int 

表 中 的 数据 如 下 。 


账 户 金额 /元 


1001 1800 


1002 2600 


这 里 以 账户 管理 为 例 , 说 明 对 并 发 操作 不 加 以 限制 ,会 产生 数据 不 一 致 性 问题 ,这 种 
问题 共有 4 类 : 丢失 更 新 、 脏 读 、 不 可 重复 读 、 幻 象 读 。 

当 两 个 或 多 个 事务 选择 同一 行 , 然 后 基于 最 初 选 定 的 值 更 新 该 行 时 ,会 发 生 丢 失 更 新 
问题 。 每 个 事务 都 不 知道 其 他 事务 的 存在 。 最 后 的 更 新 将 覆盖 由 其 他 事务 所 做 的 更 新 ， 
这 将 导致 数据 丢失 。 

假设 账户 1001 的 金额 为 1800 元 ,现在 甲 执行 一 个 事务 存 人 200 元 , 乙 执行 另 一 个 事 
务 取 出 400 元 。 
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同时 发 和 


见 表 4-3, 发 生 了 “丢失 更 新 ”错误 。 


表 4-3 发 生 丢失 更 新 的 过 程 


E 存 人 ( 甲 ) 和 取出 ( 乙 ) 操 作 .这 就 形成 并 发 操作 。 一 种 可 能 的 并 发 操作 次 序 


顺 序 事 务 操 作 金额 /元 
1 甲 读 1800 
2 乙 读 1800 
$ 甲 AMOUNT 王 1800 十 200 
4 乙 AMOUNT 王 1800 一 400 
5 甲 写 2000 
6 乙 写 1400 


当 甲 和 乙 并 发 执行 时 ,在 甲 对 数据 库 更 新 的 结果 没有 提交 之 前 , 乙 使 用 了 甲 的 结果 ， 
而 在 乙 操作 之 后 甲 又 回 滚 , 这 时 引起 的 错误 是 乙 读 取 了 甲 的 * 脏 数据 "。 表 4-4 所 示 的 执 
行 过 程 就 产生 了 这 种 错误 。 


顺 


表 4-4 “ 脏 读 ? 过 程 
序 事 务 操 作 


金额 /元 


读 


1800 


AMOUNT 王 1800 十 200 


写 


2000 


读 


2000 


AMOUNT 王 2000 一 400 


ROLLBACK 


1800 


vA 


NI 于 |ININ| 于 | 于 | 悦 


写 


1600 


当 事 务 甲 多 次 访问 同一 行 而 且 每 次 读 取 同 一 数据 时 ,可 能 会 发 生 不 一 致 的 问题 ,因为 
事务 乙 也 可 能 正在 更 改 甲 事务 正在 读 取 的 数据 。 因 而 该 行 被 认为 不 可 重复 读 取 。“ 不 可 
重复 读 ” 的 过 程 见 表 4-5。 


表 4-5 “不 可 重复 读 ” 的 过 程 


序 事 务 操 作 


金额 /元 


读 AMOUNT 王 1800 


1800 


读 AMOUNT 王 1800 


写 AMOUNT 王 AMOUNT 一 400 


1400 


寺 |ININ| 于 


读 AMOUNT 二 1400( 同 一 事务 ,两 个 读 取 结果 ) 


当 对 某 行 执行 插入 或 删除 操作 ,而 该 行 属于 某 个 事务 正在 读 取 的 行 的 范围 时 ,会 发 生 
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幻象 读 问 题 。 事 务 第 一 次 读 的 结果 集 其 中 一 行 已 不 复 存在 于 第 二 次 读 或 后 续 读 中 ,因为 
该 行 已 被 其 他 事务 删除 。 同 样 ,由 于 其 他 事务 的 插入 操作 ,事务 的 第 二 次 或 后 续 读 结果 集 
有 一 行 已 不 存在 于 原始 读 中 。 

并 发 操作 之 所 以 产生 错误 ,是 因为 任务 执行 期 间 相互 干扰 造成 的 。 当 将 任务 定义 成 
事务 ,事务 具有 的 特性 (特别 是 隔离 性 ) 得 以 保证 时 ,就 会 避免 上 述 错误 发 生 。 但 是 ,如 果 
只 允许 事务 串 行 操作 ,会 降低 系统 的 效率 。 所 以 ,多 数 DBMS 进行 并 发 控制 , 既 保 证 了 数 
据 的 一 致 性 ,又 保障 了 系统 效率 。 


4.10.4 隔离 级 别 


为 了 遵守 ACID 规则 ,一 个 事务 必须 与 其 他 事务 相隔 离 。 这 意味 着 在 一 个 事务 中 使 
用 的 数据 必须 与 其 他 事务 相隔 离 。 为 了 实现 这 种 分 离 , 每 一 个 事务 都 会 锁 住 它 使 用 的 数 
据 , 以 防止 其 他 事务 使 用 它 。 锁 定义 在 需要 锁定 的 资源 上 ,这 些 资 源 可 以 是 索引 、 数 据 行 
或 者 表 。SQL Server 总 会 尝试 小 粒度 地 锁 住 资源 。 在 大 多 数 情况 下 , 它 会 首先 基于 行 级 
加 锁 。 如 果 锁 住 的 行 太 多 ,会 自动 提升 锁 至 表 级 ,这 个 过 程 是 自动 完成 的 。 

SQL Server 通过 使 用 不 同类 型 的 锁 隔 离 事务 。 定 义 事务 内 容 以 及 应 在 何 种 情况 下 
回 滚 至 关 重 要 ,定义 如 何以 及 在 多 长 时 间 内 在 事务 中 保持 锁定 也 同等 重要 ,这 由 隔离 
级 别 决定 。 事 务 准备 接受 不 一 致 数据 的 级 别称 为 隔离 级 别 。 隔 离 级 别 是 一 个 事务 必 
须 与 其 他 事务 进行 隔离 的 程度 。 较 低 的 隔离 级 别 可 以 增加 并 发 ,但 代价 是 降低 数据 的 
正确 性 。 相 反 , 较 高 的 隔离 级 别 可 以 确保 数据 的 正确 性 ,但 可 能 对 并 发 产生 负面 影响 。 
应 用 不 同 的 隔离 级 别 ,为 每 一 个 单独 事务 定义 与 其 他 事务 的 隔离 程度 。 事 务 隔 离 级 别 
的 定义 如 下 。 

未 提交 读 (READ UNCOMMITTED, 事 务 隔离 的 最 低级 别 )。 在 读数 据 时 不 会 检查 
或 使 用 任何 锁 ,因此 ,在 这 种 隔离 级 别 中 可 能 读 取 到 没有 提交 的 数据 。 

提交 读 (READ COMMITTED,SQL Server 默认 级 别 )。 只 能 读 取 已 经 提交 的 数据 。 
某 事务 读数 据 期 间 , 其 他 事务 可 以 读 取 相 同 的 数据 ,但 不 能 更 新 ;在 某 事务 更 新 数据 期 间 ， 
其 他 事务 不 能 读 取 同样 的 数据 。 

可 重复 读 (REPEATABLE READ)。 同 已 提交 读 级 别 那样 读数 据 , 但 某 事务 读 完 数 
据 后 并 不 立即 允许 其 他 事务 更 新 相同 的 数据 ,而 是 整个 事务 结束 后 才 允 许 其 他 事务 更 新 
同样 的 数据 。 

可 串 行 读 CSERIALIZABLE, 事 务 隔离 的 最 高 级 别 . 事 务 之 间 完 全 隔离 )。 其 工作 方 
式 类 似 于 可 重复 读 。 但 它 不 仅 会 锁定 读 取 的 数据 行 , 还 可 能 会 锁定 整个 表 ,这 样 就 阻止 了 
新 数据 的 插入 ,从 而 可 以 防止 幻象 读 。 隔 离 级 别 与 数据 不 一 致 问题 见 表 4-6 。 

表 4-6 ”隔离 级 别 与 数据 不 一 致 问题 


隔离 级 别 脏 读 丢失 更 新 不 可 重复 读 幻象 读 
未 提交 读 是 是 是 是 
提交 读 否 是 是 是 
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续 表 
隔离 级 别 脏 读 丢失 更 新 不 可 重复 读 幻象 读 
可 重复 读 否 否 否 是 
可 串 行 读 和 否 得 否 


无 论 定 义 什么 隔离 级 别 , 某 事务 对 数据 的 更 改 总 是 等 到 事务 结束 后 才 允 许 其 他 事务 
对 这 些 数据 进行 读 取 和 更 改 。 打 开 管 理 器 的 “工具 "菜单 ,选择 “选项 ”, 在 “查询 执行 /SQL 
Server / 高 级 "中 可 以 设置 事务 的 隔离 级 别 , 如 图 4-16 所 示 。 默 认 的 隔离 级 别 是 READ 


COMMITTED (提交 读 ) 。 


键盘 
由 -帮助 
日 -文本 篇 名 器 
文件 扩展 名 
由 Transact-SQL 


由 SQL Server 对 象 资源 管理 器 


指定 高 级 执行 设置. 

回 SET NOCOUNT(N) 

回 SET NOEXEC(O) 

回 SET pPARSEONLYO) 

SET CONCAT NULLYIELDS NULLO 
SET TRANSACTION ISOLATION LEVELO: 
SET DEADLOCK_PRIORITY(D): 

SET LOCK TIMEOUT): 


SET QUERY_GOVERNOR_COST_LIMIT(Q): 
取消 提供 程序 消息 标 头 (M) 
回 执行 查询 后 断 开 连接 人 


SET ARITHABORT(B) 

回 SsET SHOWPLAN_TEXT(S) 
回 SET STATISTICS TIMEGE) 
回 SsET STATISTICS IO(A) 


图 4-16 设置 隔离 级 别 


下 面 的 操作 步骤 演示 了 * 提 交 读 ”隔离 级 别 下 的 并 发 行为 。 假 设 用 户 甲 输入 并 执行 以 
下 语句 ,在 account 表 中 读 取 账户 1001 的 金额 。 


EEGIN TRAN 
SEIECT 账户 , 金额 
FRM acoount 

WHERE 账户 = "1001' 


现在 用 户 乙 启 动 男 一 事务 在 用 户 甲 事务 打开 状态 下 更 改 了 金额 。 打 开 第 二 个 查询 窗 
口 并 执行 以 下 语句 ,但 不 提交 事务 。 


BEGIN TRAN 

UPDATE account 

SET 金额 = 金额 +200 
WHERE 账户 = "1001" 


第 和 和 饥 入 级 舌 多 分 轴 扎 中 


这 个 UPDATE 语句 会 正常 运行 .因为 已 提交 读 级 别 中 甲 事务 对 数据 读 取 1001 账户 
完毕 ,就 立即 允许 乙 更 新 1001 账户 了 ,而 并 不 等 待 整个 事务 结束 。 
用 户 甲 再 次 查询 : 


SEIECT 账户 , 金额 
FROM account 
WHERE 账户 = '1001" 


在 提交 读 级 别 ( 默 认 级 别 ) ,由 于 乙 正 在 对 账户 1001 进行 更 新 ,事务 尚未 提交 ,所 以 甲 
的 SELECT 语句 被 阻塞 。 这 个 阻塞 直到 乙 的 事务 结束 。 
用 户 乙 执行 一 个 ROLLBACK TRAN 语句 回 深 UPDATE 语句 。 


ROLLEACK TRAN 


在 用 户 乙 结束 事务 后 ,用 户 甲 的 查询 完成 了 ,并 且 其 结果 与 以 前 的 一 样 。 用 户 乙 的 事 
务 结束 ,用 户 甲 的 查询 不 再 被 阻塞 。 由 于 用 户 乙 的 事务 回 深 , 因 此 用 户 甲 得 到 的 结果 是 原 
来 的 数据 。 如 果 用 户 乙 的 事务 被 提交 , 则 用 户 甲 会 得 到 新 的 数据 并 将 其 作为 结果 。 

可 以 看 出 ,在 已 提交 读 级 别 (SQL Server 默认 ) 中 ,SQL Server 会 等 到 含有 更 新 操作 
的 事务 结束 之 后 再 允许 其 他 事务 进行 读 操作 ,以 此 获取 真正 的 提交 数据 。 还 可 以 看 出 , 某 
事务 读 取 数据 操作 结束 之 后 就 立即 允许 其 他 事务 对 这 些 数 据 进 行 更 新 操作 ,而 不 持续 到 
含有 读 操 作 的 事务 提交 之 后 。 由 于 数据 更 新 事务 造成 阻塞 ,因此 读数 据 会 非常 慢 。 

“提交 读 ” 级 别 的 一 个 缺点 是 ,一 个 事务 读 取 的 数据 在 事务 运行 期 间 可 能 被 另 一 个 事 
务 更 改 。 因 此 ,在 “提交 读 ? 级 别 下 ,不 能 保证 在 一 个 事务 中 读 取 的 数据 始终 一 样 。 

再 次 执行 上 面 的 过 程 , 不 同 的 地 方 是 ,让 用 户 乙 提交 事务 ,然后 让 用 户 甲 再 次 读 取 账 
户 1001 ,再 提交 自己 的 事务 ,发 现 甲 在 一 个 事务 中 对 账户 1001 读 取 的 结果 前 后 不 一 致 。 

下 面 设置 使 用 “可 重复 读 " 隔 离 级 别 , 防 止 含有 读 操作 的 事务 结束 前 其 他 事务 更 改正 
在 读 的 数据 。 

用 户 甲 在 查询 窗口 中 执行 以 下 代码 : 


SET TRANSACTTION ISOLATION IEVEL, REPEATABIE FEAD 
SELECT 账户 , 金额 

ERCM account 

WHERE 账户 = "1001' 


用 户 乙 在 另 一 个 查询 窗口 执行 以 下 代码 进行 更 新 : 


EEGIN TRAN 
UPDATE account 

SET account =account + 200 
WHERE 账户 = '1001" 
CCMMIT 


因为 处 于 可 重复 读 隔离 级 别 , 含 有 读 操作 的 事务 会 防止 其 他 事务 更 改 数据 ,所 以 用 户 
乙 的 更 新 会 被 阻塞 。 
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现在 用 户 甲 再 次 执行 如 下 查询 : 
serEcT 账户 ,金额 


FPROM account 
WHERE 账户 = '1001" 


因为 用 户 乙 的 更 新 被 阻塞 ,所 以 用 户 甲 两 次 查询 的 结果 相同 。 
现在 用 户 甲 提 交 ,发 现 用 户 乙 也 提交 了 。 
在 “可 重复 读 ? 隔 离 级 别 情况 下 ,用 户 甲 在 查询 窗口 中 执行 以 下 代码 : 


BEGIN TRAN 
SEIECT 账户 ,金额 
ERCM account 

WHERE 账户 = '1001" 


用 户 乙 打开 第 二 个 查询 窗口 并 执行 以 下 代码 尝试 插入 ， 
INSERT INIO account VALLES ('1001', 800) 


即使 正 处 于 “可 重复 读 ” 隔 离 级 别 ,这 个 语句 也 会 成 功 执行 。 因 为 可 重复 读 只 禁止 在 
本 事务 提交 前 其 他 事务 更 新 本 事务 内 读 操作 涉及 的 数据 。 但 INSERT 语句 向 数据 库 中 
插入 新 数据 ,这 是 允许 的 。 新 行 处 于 用 户 甲 的 事务 中 SELECT 语句 的 查询 范围 之 内 ,所 
以 会 在 事务 下 一 次 获取 相同 条 件数 据 的 时 候 被 读 取 到 。 这 种 情况 称 作 “ 幻 象 读 ”。 
用 户 甲 重复 SELECT 语句 并 提交 这 个 事务 ,代码 如 下 所 示 。 


SELECT 账户 , 金额 
FPOM account 
WHERE 账户 = "1001' 
COMMIT TRAN 


可 以 观察 到 ,新 行 被 SELECT 语句 读 取 了 ,因为 它 处 于 这 个 语句 的 查询 范围 之 内 。 
这 就 是 造成 用 户 甲 的 同一 事务 中 两 次 查询 相同 却 得 到 不 同 的 结果 集 (幻象 读 )。 为 了 防止 
这 种 现象 ,可 以 使 用 “可 序列 化 ”隔离 级 别 。 这 种 隔离 级 别 比 可 重复 读 级 别 更 严格 ,不仅 会 
锁定 事务 读 取 的 数据 ,还 会 锁定 事务 的 读 取 范 围 。 但 是 ,不 是 万 不 得 已 ,一般 不 使 用 可 序 
列 化 隔离 级 别 。 

假设 希望 用 户 甲 和 以 前 一 样 查看 同样 的 金额 ,现在 使 用 “可 序列 化 ”隔离 级 别 阻 止 更 
新 数据 ,并 且 阻 止 “ 幻 象 读 "。 执 行 以 下 查询 : 


SET TRANSACTTON ISOLATTON TEVEL, SERIRLIZREIE 
BEGIN TRAN 

SEIECT 账户 ,金额 

FROM account 

WHERE 账户 = '1001" 


用 户 乙 打开 第 二 个 查询 窗口 插入 一 个 新 行 : 


INSERT INTO account VALUES ('1001", 800) 
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发 现 用 户 乙 的 插入 被 阻塞 。 
使 用 下 面 语句 回 到 默认 的 “提交 读 ” 隔 离 级 别 。 


SET TRANSACTION ISOLATTON TEVEL READ OOMMITTFD 


4.11 在 审计 脚本 语言 中 应 用 SQL 语句 


在 审计 过 程 中 ,审计 人 员 对 某 类 问题 ,如 检查 部 门 项 目 支出 预算 草案 编制 程序 的 合 规 
人 性 ,检查 部 门 项 目 支出 预算 草案 编制 程序 的 真实 性 ,检查 部 门 项 目 支出 预算 草案 编制 程序 
的 合理 性 ,检查 部 门 项 目 支出 预算 草案 编制 程序 的 完整 性 等 ,形成 了 较为 成 熟 的 审计 数据 
查询 分 析 方 法 ,这 些 方法 由 不 止 一 条 SQL 语句 组 成 ,往往 涉及 中 间 结 果 和 逐条 分 析 等 。 
而 且 这 些 问 题 均 具 有 相同 或 者 类 似 的 业务 模型 。 那 么 ,这 些 审计 方法 就 可 以 使 用 ASL 
(审计 脚本 语言 ) 表 述 出 来 ,存储 在 审计 师 办 公 软 件 (Auditor Office,AO) 系 统 中 。 当 遇 到 
同类 型 的 审计 项 目 或 者 类 似 的 审计 需求 时 ,审计 人 员 就 可 以 从 系统 中 保存 的 审计 方法 中 
选择 一 个 作为 参考 ,或 者 在 自己 的 电子 数据 上 直接 运行 该 方法 。 

一 个 ASL 程序 通常 由 说 明 部 分 和 语句 部 分 组 成 。 


1. 说 明 部 分 


程序 中 用 的 常量 、 变 量 , 或 类 型 及 过 程 与 自 定义 函数 , 需 在 使 用 之 前 预先 说 明 。 程 序 
中 的 VAR CurQuery， EndofResult，CurDiff; 是 变量 说 明 。 在 当前 计算 机 上 ,被 处 理 的 
数据 存放 在 变量 中 ,实现 处 理 的 语句 (指令 ) 完 成 对 变量 中 数据 的 计算 或 者 变换 ,处 理 的 结 
果 往 往 需 要 保存 在 磁盘 这 样 的 外 部 设备 上 。 好 比 是 使 用 算盘 : 数据 安排 在 算盘 上 ,算盘 
的 操纵 者 根据 预 设 的 方法 (规则 、 步 又 ) 不 断 变换 算盘 上 的 数据 ,计算 的 结果 写 到 账本 (外 
部 设备 ) 上 。 

变量 说 明 的 作用 就 是 在 计算 机 中 给 数据 安排 存放 的 地 盘 。VAR CurQuery， 
EndofResult，CurDiff; 安排 了 3 个 地 盘 , 分 别 以 CurQuery, EndofResult 和 CurDiff 
标识 。 

除了 说 明 变 量 外 ,还 可 以 使 用 CONST 声明 常量 ,如 CONST PI 二 3. 1415926; 使 用 
ARRAY 声明 数组 。 


2 语句 部 分 


语句 部 分 指 保留 字 BEGIN( 开 始 ) 至 END. (结尾 ) 之 间 的 语句 系列 ,这 些 语 句 是 解决 
问题 的 具体 处 理 步骤 ,将 被 计算 机 从 上 至 下 地 顺序 执行 。 

ASL 脚本 程序 不 管 是 哪 部 分 ,每 句 末尾 都 必须 有 分 号 (;) ,程序 结束 的 END 末尾 必 
须 有 圆 点 (. ) ,是 整个 程序 的 结束 标志 。 

程序 中 “//” 到 行 末 之 间 的 部 分 为 程序 注释 。 注 释 是 给 审计 人 员 看 的 ,计算 机 完全 不 
理会 这 些 内 容 。 注 释 非常 重要 ,并 非 可 有 可 无 。 注 释 以 人 的 语言 表达 了 审计 方法 的 思路 ， 
易于 理解 。 注 释 为 其 他 审计 人 员 阅 读 或 者 日 后 自己 阅读 程序 均 提供 了 基础 ,否则 很 容易 
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发 生 若干 年 后 自己 看 不 懂 自 己 的 程序 的 情况 。 


典型 的 ASL 程序 结构 如 下 所 示 。 
VRR currentQuery, EndofRowSet; 变量 说 明 
BEESIN 
语句 系列 ; 语句 部 分 
END. 
完整 的 ASL 程序 结构 如 下 所 示 。 
eg ， 常量 说 明 / 诺 量 说 明 部 分 
i 
RERRY … 


语句 序列 过 程 或 函数 说 明 
END; 
BESIN 

语句 系列 :f 语句 部 分 ( 主 程序 ) 
END. 


把 处 理 问题 的 步骤 编 成 能 从 上 到 下 顺序 执行 的 程序 ,是 程序 的 基本 特征 。 

AO 的 [审计 分 析 】I【 审 计 方法 3】I【 审 计 方 法 管理 ] 为 审计 人 员 添 加 新 的 审计 方法 、 参 
考 和 使 用 已 有 的 审计 方法 提供 了 环境 。 审 计 人 员 可 使 用 ASL 编写 审计 方法 作为 “审计 
师 ” 方 法 保存 。 

AO 系统 中 的 每 个 审计 方法 都 包括 一 个 或 者 若干 个 审计 步骤 ,每 个 审计 步骤 就 是 一 
段 ASL 程序 ;每 个 审计 步骤 中 可 以 包括 一 个 或 者 若干 个 SQL 语句 ,这 些 SQL 语句 就 是 
每 段 ASL 程序 的 核心 。 


4.11.1 ASL 中 的 运算 符 
审计 脚本 语言 中 的 运算 符 有 赋值 运算 符 、 算 术 运 算 符 、 关 系 运算 符 和 逻辑 运算 符 等 。 


1 赋值 运算 符 
赋值 运算 符 使 用 *: = 二”, 表 示 把 该 运算 符 右 侧 表达 式 的 值 存 入 左 侧 的 变量 中 。 例 如 : 
TnputNnber :=123; // 数 值 赋值 , 读 作 :把 123 赋 值 给 变量 Inputhiniber 


Inputstring := 'ABCTEFG'; ”// 字 符 串 赋值 
注意 ,变量 必须 先 声明 ,后 使 用 。 


2 算术 运算 符 
ASL 中 的 算术 运算 符 见 表 4-7。 
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表 4-7 算术 运算 符 
算术 运算 符 说 明 算术 运算 符 说 明 
二 加 号 关 乘 号 
二 减 号 除 号 
例如 ， 
InputNumber :=2 +3; 
InputNuriber := InputNinber +1; 
3 关系 运算 符 
ASL 中 的 关系 运算 符 见 表 4-8。 
表 4-8 关系 运算 符 
关系 表达 式 说 明 关系 表达 式 说 明 
等 于 过 学 和 不 等 于 
< 小 于 <= 小 于 或 等 于 
大 于 > 二 大 于 或 等 于 
关系 运算 符 用 来 构造 关系 表达 式 , 例 如: 
InputNumber >1 
InputNumber <> 100 
4 远 辑 运算 符 
ASL 中 的 逻辑 运算 符 见 表 4-9。 
表 4-9 逻辑 运算 符 
逻辑 运算 符 说 明 逻辑 运算 符 说 明 
AND 与 NOT 非 
OR 或 


逻辑 运算 符 用 来 构造 逻辑 表达 式 。 例 如 ,表达 式 NOT (3 二 2) AND (2 > 1) 的 运 
算 结果 为 * 假 ”。 


4.11.2 ASL 中 的 分 支 语句 


分 支 语句 的 格式 有 两 种 。 

(1) IF 志 逻 辑 表 达 式 十 THEN 语句 。 执 行 IF 语句 时 , 先 计 算 志 逻辑 表达 式 二 的 值 ， 
车 为 TRUE, 则 执行 语句 ,和 否则 不 执行 任何 操作 。 

(2) IF 到 逻辑 表达 式 之 THEN 语句 1 ELSE 语句 2。 执 行 IF 语句 时 , 先 计算 一 逻辑 
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表达 式 二 的 值 , 若 为 TRUE, 则 执行 语句 1 ,否则 执行 语句 2。 
例如 ,设计 ASL 脚本 ,判断 一 个 变量 是 否 是 正 数 ,如 果 是 , 则 显示 “ 正 数 ”: 


VARa; 
BEGTN 
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IF a>0 THEN 

write(' 正 数 "); 

END. 
在 这 段 脚本 中 ,应 注意 以 下 7 个 问题 。 
(1) 在 字符 串 字 面 量 上 使 用 单 引 号 。 下 面 的 脚本 中 , write( 正 数 ) 未 使 用 单 引 号 把 * 正 


数 " 引 起 来 ,是 语法 错误 的 语句 。 


VARa; 
BEGSIN 
a :=0; write(a); write('a'); 
IFa>=0 THEN 
write 正 数 ); // 正 数 "是 字符 串 字面 量 ,要 求 用 单 引 号 引起 来 


END. 
(2) BEGIN 和 END 括 起 来 的 语句 可 以 写 在 同一 行 上 ,也 可 以 写 在 不 同行 上 。 语 句 
位 置 不 影响 正确 性 。 


VRRar 
BESIN a :=0; 下 a>0THEN write(' 正 数 '); END. 


(3) BEGIN END. 不 能 省 略 。 下 面 的 写法 是 错误 的 。 


VPRar 
a:=0; 
IE a >0 THEN 
write(' 正 数 '); 
(4) 语句 要 全 部 放 在 BEGIN END. 中 。 下 面 的 脚本 把 “a: 二 0” 语 句 写 在 了 BEGIN 
和 END 之 外 ,是 错误 的 。 


VPRa 
a:=0; 
BEGIN 
IF a >0 THEN 
write(' 正 数 '); 
END. 


(5) 大 小 写 不 敏感 。 下 面 的 脚本 中 ,a 和 A 是 同一 个 变量 。 


VARa; 
PEGIN 
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A:=0; 
ifa>0 then 
write(' 正 数 '); 
END. 


(6) 采用 适当 的 缩 进 ,使 得 源 代码 看 起 来 清晰 。 


VPRar 

EEGIN 
a:=0; // 铀 进 2 个 空格 
IF a>0 THEN // 编 进 2 个 空格 
write(' 正 数 '); // 编 进 4 个 空格 
ED. // 与 BESN 对 齐 


(7) IF 语句 可 以 写 在 一 行 上 ,也 可 写 在 多 行 上 。 


VARa; 
EEGIN 
a:=0; 
下 a>0 THEN write(' 正 数 '); 
END 


当 有 多 条 语句 从 属于 IF 语句 时 ,要 使 用 BEGIN END 把 这 些 语句 括 起 来 。 


VPR ar 
BEGIN 
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IFa>=0 THEN 

BESIN 

write(a); 

write(' 是 非 负 数 '); 
END; 
END. 


再 如 ,设计 ASL 脚本 ,判断 输入 的 一 个 数字 是 否 为 正 数 , 若 为 正 数 , 则 显示 “你 输入 的 
数 为 正 数 ”; 若 为 负数 , 则 显示 “你 输入 的 数 为 负数 ”; 若 为 0, 则 显示 “你 输入 的 数 是 零 ”。 
脚本 如 下 。 


VPR a; 
BESIN 

Read(a); 
IFa<>0 THEN 

BEGIN 

IEa>0OTHEN 
EEGIN 
write(' 你 输入 的 数 是 正 数 '); 


END 
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ELSE 
BEGIN 
Write(' 你 输入 的 数 是 负数 '); 
END; 
END 
FISE 
BESIN 
write('" 你 输入 的 数 是 零 '); 
END; 
END. 


再 看 一 个 例子 。 判 断 一 个 变量 a 是 否 大 于 或 等 于 0, 如 果 是 , 则 显示 “是 非 负数 ”; 否 
则 显示 “是 负数 "。 脚 本 为 


VARa; 
BESIN 
a:=]l; 
IFa>=0 THEN 
write('" 是 非 负 数 '); 
IF a <0 THEN 
write(' 是 负数 '); 
END. 
当 变 量 a 确实 为 非 负数 时 ,第 2 个 分 支 语句 就 没有 必要 执行 了 。 所 以 ,这 种 情况 下 最 
好 的 脚本 应 是 


VPRar 
BEGIN 
已 :=17 
IEa>=0THEN 
write(" 是 非 负数 ); 
ELSE 
write(' 是 负数 '); 
END. 


4.11.3 ASL 中 的 循环 语句 


ASL 中 的 循环 语句 有 两 种 : 当 型 循环 (while 循环 ) 和 直到 型 循环 (until 循环 ) 。 
while 语句 的 形式 为 

while < 逻辑 表达 式 >do < 语句 >; 

其 意义 为 : 当 逻 辑 表达 式 的 值 为 TRUE 时 ,执行 do 后 面 的 语句 。 

while 语句 的 执行 过 程 为 

@ 判断 逻辑 表达 式 的 值 ,如 果 其 值 为 真 , 则 执行 步骤 四 ,否则 执行 步骤 @ 。 

@ 执行 循环 体 语句 (do 后 面 的 语句 ) 。 
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@ 返回 步骤 0 。 

@ 结束 循环 ,执行 while 的 下 一 个 语句 。 

这 里 的 while 和 do 为 保留 字 。while 语句 的 特点 是 , 当 人 逻辑 表达 式 成 立时 ,重复 执行 
do 后 面 的 语句 (循环 体 ) 。 

例如 ,从 键盘 输入 5 个 数 : 11,2,13,40,10, 累 加 并 输出 结果 。 下 面 的 脚本 可 以 完成 
本 例 的 功能 。 


VARRa,s; 


定 印 分 入 :内 用 司 由 贸 刁 


但 是 ,如 果 题 目 给 出 500 个 数 , 则 需要 简洁 的 方法 表达 重复 执行 语句 “Read(a) 和 s: 一 
s 十 a”。 这 就 会 使 用 到 while 语句 。 使 用 while 语句 的 脚本 如 下 。 


write(s); 
END. 


while 语句 的 组 成 部 分 如 图 4-17 所 示 。 


循环 变量 初始 化 


while iDoI 


BEGIN 
Read(a); 循环 条 件 


Ss+ 
it 
END， | 


图 4-17 while 语 句 的 组 成 部 分 


循环 体 


修改 循环 变量 


while 语句 的 执行 流程 是 : 首先 判断 循环 条 件 是 否 满足 , 若 满足 , 则 执行 循环 体 , 和 否则 
执行 下 一 条 语句 。 

使 用 while 应 注意 : 循环 变量 必须 初始 化 ;必修 修改 循环 体 中 循环 变量 的 语句 ,否则 
会 出 现 死 循环 现象 。 

例如 ,设计 ASL 脚本 ,从 键盘 输入 若干 个 正 数 进行 累加 , 当 输 入 的 数 是 0 时 结束 并 输 
出 结果 。 脚 本 为 


VPRa 3; 
BEGIN 
// 循环 累加 正 数 
3 渤 07 
// 输入 一 个 数字 
Read (a); 
while a>0 DO 
BESIN 
// 累 加 输入 的 数字 
EF 


// 输 入 下 一 个 数字 
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Read (a); 
Engd; 
Write(s); // 显 示 累 计 结 果 
End. 


在 这 个 例子 中 ,常见 的 错误 有 3 个。 
错误 1, 循 环 变量 没有 初始 化 ,如 下 面 的 脚本 所 示 。 


VARRa, s7 
BESIN 
// 循环 累加 正 数 
5 :一 07 
while a>0 DD /Ma 没 有 初始 值 ,无 法 判断 
BESIN 
// 累 加 输入 的 数字 
s:= sta; 
// 输入 下 一 个 数字 
Read (a); 
END; 
Write(s); // 显 示 累 计 结果 
End. 


错误 2, 丢失 了 边界 上 的 数据 ,如 下 面 的 代码 所 示 。 


VARa, 5; 
BEGIN 
/1/ 循环 累加 正 数 
s:=0; 
// 输入 一 个 数字 
Read (a); 
while a>0 DO 
BESIN 
// 输入 下 一 个 数字 
Read(a); // 累 加 和 中 丢失 了 第 1 个 数 
// 累 加 输入 的 数字 
3 stas 
End; 
Write(s); // 显 示 累 计 结 果 
End. 


问题 3, 忘 记 使 用 BEGIN…END 把 循环 体 括 起 来 ,如 下 面 的 代码 所 示 。 


VARa, 3; 
BEGIN 
3 渤 07 
Read(a) 7 
while a>0 DO 


二 二 分 本: 从 的 丽 到 类 此 | 扬 


用 while 语句 可 以 实现 * 当 型 循环 ”; 用 repeat-until 语句 可 以 实现 “直到 型 循环 ”。 
repeat-until 语句 的 含义 是 :“ 重 复 执行 循环 ,直到 指定 的 条 件 为 真 时 为 止 。 
repeat-until 循环 语句 的 一 般 形式 为 


repeat 
< 语句 1>: 


< 语句 m>; 

until < 逻辑 表达 式 > 

其 中 ,repeat ,until 是 ASL 保留 字 ,repeat 与 until 之 间 的 所 有 语句 称 为 循环 体 。 

repeat 语句 的 特点 是 : 先 执行 循环 ,后 判断 结束 条 件 , 因 而 至 少 要 执行 一 次 循环 体 。 
repeat-until 是 一 个 整体 , 它 是 一 个 语句 ,不 要 误 认为 repeat 是 一 个 语句 ,until 是 另 一 个 
语句 。repeat 语句 在 逻辑 表达 式 的 值 为 " 真 " 时 不 再 执行 循环 体 , 且 循环 体 可 以 是 若干 个 
语句 ,不 需 用 begin 和 end 把 它们 包 起 来 , repeat 和 until 已 经 起 了 begin 和 end 的 作用 。 
while 循环 和 repeat 循环 是 可 以 互相 转换 的 。 

例如 ,设计 ASL 脚本 ,提示 用 户 输 入 一 个 数字 ,如 果 输 入 的 数 是 0, 则 停止 ;否则 将 输 
入 的 数字 累加 ,并 在 最 后 显示 累加 结果 。 脚 本 如 下 。 


VARa, 3; 
BEGIN 
// 输入 一 个 数字 
Read(a) 
// 循环 累加 正 数 
3:=0; 
repeat 
PEGIN 
// 累 加 输入 的 数字 
s= sta; 
// 输入 下 一 个 数字 
Read (a); 
End; 
until a=0 
Write(s); // 显 示 累 计 结 果 
End. 


注意 ,repeat 循环 先 执行 循环 体 ,后 判定 循环 条 件 ; 而 while 语句 则 是 先 判断 循环 条 
件 , 后 执行 循环 体 。 所 以 ,repeat 中 的 循环 体 至 少 执行 1 次 ;而 while 中 的 循环 体 可 能 一 
次 也 不 执行 。 
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由 于 repeat 循环 至 少 执行 一 次 ,所 以 上 面 的 脚本 可 以 在 省 略 循环 前 读 语 句 ,但 是 需 
要 调换 循环 体 中 两 个 语句 的 位 置 。 


VRar sr 


4.11.4 从 脚本 中 访问 数据 库 


假设 已 经 导入 了 某 财 务 数据 库 , 其 中 有 表 “ 凭 证 库 ” 存 放 了 凭证 。 把 1 月 份 1 号 凭证 
和 3 号 凭证 加 入 疑点 库 作 为 未 落实 疑点 。 

首先 ,在 SQL 查询 器 中 执行 以 下 SQL 语句 ,以 确认 1 号 和 3 号 凭证 可 以 从 数据 库 中 
查询 出 来 。 

SEIECT DISTINCT 源 凭证 号 

FRCM 凭证 库 WHERE 会 计 月 份 =1 AND (凭证 号 ='1' oR 凭证 号 = '3') 


当 SQL 语句 实验 成 功 后 ,再 执行 以 下 脚本 。 


var 0 ERM 
begin 
Q:=createQ('select DISTINCT ([ 源 凭 证 号 ] from [凭证 库 ] where [会 计 月份 ]=1 aND ([ 凭 证 号 ] = "1" 
QR [凭证 号 ]="3" -IJ 
E: =qeof (0); 
WhileE<>1d 
begin 
R :=qfcvalue (0, ' 源 凭证 号 '); /字段 名 * 源 凭证 号 ?要 用 单 引 号 引起 来 
write (R);//addvourslt (BR); 
M :一 gmov(Q,1)7 
E :=qeof QQ; 
end; 
end. 


再 如 , 读 取 凭证 库 中 的 一 月 份 凭证 ,把 凭证 号 为 1 的 凭证 放 在 未 落实 疑点 ;把 凭证 号 
为 2 的 凭证 放 到 已 落实 疑点 。 脚 本 如 下 。 


VARRQOE,V,S,M 
PEGIN 


审 击 分析 :从 类 忒 到 人 大 数据 


// 从 凭证 库 中 查询 想 要 的 凭证 ,将 查询 结果 存放 到 一 个 地 方 得 询 变量 ) 
Q := createQ('select * fram [凭证 库 ] where [会 计 月 份 ]=1 aND ([ 凭 证 号 ] = " CR [ 攒 证 号 ]="2")',- 


Ds; 
E :=qeof (a); 
WhileE<>1do 
begin 


// 查 看 当前 行 的 凭证 号 是 否 是 1, 如 果 是 , 则 放 入 未 落实 疑点 
V :=qfdvalue (a, "凭证 号 '); 
IFV=1 THEN 


EESN 


S :=qfdvalue (a, ' 源 凭证 号 '); 
addivourslt (S); 


END; 


// 查 看 当前 行 的 凭证 号 是 否 是 2, 如 果 是 , 则 放 入 已 落实 疑点 


IFV=2 THEN 


BEESIN 


S :=qfdvalue (a, ' 源 凭证 号 '); 
addvouDout (S) 7 


END; 


M := qov (QD); 
E := qeof @); 


end; 
END. 


注意 : 如 果 同 一 次 重复 存 入 相同 的 凭证 (以 源 凭 证 号 标识 ), 则 在 疑点 库 中 只 保存 


二 要。 


ASL 中 相关 访问 数据 库 的 函数 的 解释 见 表 4-10。 


函 数 


表 4-10 ASL 中 相关 访问 数据 库 的 函数 的 解释 
功能 说 明 


CreateQ('SQL 语句 ， 
查询 变量 ) 


执行 SQL 语句 ,返回 一 个 SQL 语句 的 执行 及 结果 到 查询 变量 中 。 第 一 个 参数 
是 查询 的 SQL 语句 ,第 二 个 参数 是 使 用 过 已 经 没有 用 的 查询 变量 ,如 果 是 第 一 
次 作 查 询 , 则 填写 一 1, 这 样 做 的 好 处 是 ,节省 查询 变量 的 个 数 ,节约 资源 


QEof( 查 询 变 量 ) 


查看 查询 变量 当前 指向 的 记录 是 否 为 空 。 若 返回 1, 则 表明 为 空 


QMov (查询 变量 , 移 
动 方向 ) 


在 查询 变量 中 存 有 多 条 记录 ,其 中 有 一 条 为 当前 记录 。 该 函数 可 把 当前 记录 
的 前 一 条 或 后 一 条 记录 设置 为 新 的 当前 记录 


QFDValue( 查 询 变量 ， 
字段 名 称 ) 


取 当 前 查询 变量 当前 记录 的 字段 的 值 。 和 人 口 参数 一 个 是 查询 变量 ,一 个 是 某 
一 个 字段 的 名 称 ,需要 用 单 引 号 括 起 来 


RecordNum( 查 询 变量 
或 表 名 称 ) 


如 果 参 数 为 一 个 打开 的 查询 变量 , 则 取出 当前 查询 变量 的 记录 个 数 ;如 果 参 数 
为 数据 库 中 的 一 个 表 名 , 则 取出 该 表 的 所 有 记录 个 数 


ExecuteUpdate (' SQL 
语句 ) 


执行 数据 库 插入 、 更 新 、 删 除 (Insert,Update,Delete) 的 SQL 语句 的 函数 
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续 表 
Ed 数 功能 说 明 
CreateTempTable (' 新 疆 时 由 
表 名 '，SQL 语句 ) 把 SQL 语句 取出 来 的 结果 以 用 户 输入 的 表 名 存储 在 数据 库 中 


AddVouDout( 源 凭证 号 ) 


输出 源 凭证 号 到 疑点 库 中 ,该 源 凭证 号 对 应 的 凭证 将 被 定义 为 已 落实 疑点 


AddVouRslt( 源 凭证 号 ) 


输出 源 凭证 号 到 疑点 库 中 ,该 源 凭证 号 对 应 的 凭证 将 被 定义 为 未 落实 疑点 


AddTransDout (查询 
变量 ， 疑 点 说 明 ) 


把 指定 查询 变量 的 当前 记录 输出 到 业务 疑点 的 临时 库 中 


AddTransRslt( 查 询 变 
量 , 疑点 说 明 ); 


把 指定 查询 变量 的 当前 记录 输出 到 业务 结果 的 临时 库 中 


TransBatch (查询 变 
量 , 批量 疑点 说 明 ”) 


把 指定 查询 变量 的 业务 疑点 或 结果 临时 库 中 的 数据 写 人 业务 疑点 或 结果 库 
中 ,并 清空 相应 的 临时 库 中 的 数据 


showmsg( 消 息 内 容 ) 


显示 消息 
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多 维 数据 分 析 基 于 多 维 数据 库 观 察 数据 间 关 联 和 趋势 。 多 维 数据 库 以 事实 、 维 度 或 
者 度量 值 对 数据 进行 建 模 。 分 析 服 务 是 对 多 维 数 据 库 进行 数据 管理 和 分 析 的 引擎 。 其 体 
系 结构 如 图 5-1 所 示 。 该 体系 结构 的 核心 是 分 析 服务 ,如 Microsoft SQL Server OLAP 
Service。 来 自 财务 库 和 业务 库 的 会 计 事务 和 业务 事务 数据 经 过 数据 清洗 、 转 换 和 验证 ， 
形成 新 的 数据 库 。 基 于 新 的 数据 库 ,建立 多 维 分 析 模 型 。 通 过 分 析 服 务 运行 多 维 分 析 模 
型 ,通过 数据 透视 表 等 工具 浏览 和 分 析 ,发 现 审计 线索 。 应 用 多 维 分 析 的 优势 在 于 能 够 直 
观 地 把 握 总 体 、 分 析 趋 势 .发现 异常 .选择 重点 。 

一 个 多 维 数据 库 中 可 以 有 多 个 多 维 数据 集 , 通 过 分 析 服 务 访 问 多 维 数据 集 。 通 过 
Microsoft Excel 能 够 观察 透视 图 和 钻 取 ,分析 趋势 和 发 现 异 常 更 加 方便 。 


分 析 管 理 器 


数据 清洗 、 分 析 | 
转换 和 验证 服务 
三 || 台 | [时 


图 5-1 分 析 服 务 的 体系 结构 


建立 多 维 分 析 模 型 的 关键 是 根据 业务 需要 ,设计 维和 度量 值 。 凡 是 能 够 对 数据 进行 
分 组 的 实体 ,如 部 门 ,就 可 以 作为 维 。 事 实 表 中 的 数值 列 可 以 按照 某 个 维 进 行 分 组 汇总 ， 
这 样 的 列 称 为 度量 值 ,来自 同 一 个 事实 表 的 若干 度量 值 形成 一 个 度量 值 组 。 对 事实 的 计 
数 也 可 以 作为 度量 值 。 

多 维 数据 库 的 数据 源 通常 是 关系 型 数据 库 。 该 数据 库 中 的 数据 模式 ( 库 结构 ) 往 往 被 
转换 成 OLAP 多 维 数据 库 中 的 星 型 或 者 雪花 型 模式 。 只 要 能 通过 ODBC 或 者 OLE DB 
连接 ,多 维 数据 库 中 的 数据 也 可 以 是 非 关 系 型 数据 库 。 一 般 情况 下 ,OLE DB 和 ODBC 
Provider 作为 数据 访问 组 件 的 一 部 分 与 SQL Server 一 起 安装 。 

分 析 服 务 是 对 多 维 数据 库 进 行 数据 管理 和 分 析 的 引擎 。 审 计 人 员 往 往 需要 一 些 统计 
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汇总 信息 ,而 在 大 规模 关系 数据 库 中 通过 SQL 语句 进行 统计 汇总 是 一 个 复杂 而 且 耗 时 的 
工作 。 为 了 解决 这 个 问题 ,需要 建立 一 个 独立 的 数据 库 更 好 地 存储 用 来 进行 分 析 的 业务 
数据 。 这 个 数据 库 的 数据 来 源 于 操作 型 数据 库 , 但 必须 转换 成 星 型 或 者 雪花 型 。 在 这 种 
架构 下 ,通常 有 一 个 事实 表 。 事 实 表 记录 了 业务 活动 数据 ,如 延期 纳税 审批 活动 。 这 张 表 
会 有 上 万 ,甚至 几 十 万 行 数据 。 维 表 定 义 了 维 的 属性 级 别 和 各 级 别 的 成 员 。 

典型 的 星 形 模式 有 以 下 特点 : 只 有 一 个 事实 表 , 事 实 表 中 含有 数值 列 和 外 键 列 。 每 
个 维 只 有 一 个 维 表 , 表 中 包含 了 该 维 的 主键 及 其 他 属性 。 主 键 用 来 作为 事实 表 的 参照 ,其 
他 属性 一 般 是 对 主键 的 进一步 分 组 。 例 如 ,“ 产 品 " 维 一 般 有 “品牌 ”属性 , “品牌” 也 是 对 产 
品 的 一 种 分 组 。 

雪花 架构 将 一 个 维 拆 成 若干 个 维 。 可 将 维 表 中 成 员 之 间 的 多 对 一 关系 定义 为 一 个 独 
立 的 有 层次 体系 的 维 表 。 某 一 维 的 分 离 使 得 整个 数据 模型 看 起 来 像 雪 花 , 因 此 称 为 雪花 
模型 。 

分 析 服 务 对 数据 的 一 致 性 十 分 敏感 。 当 定义 好 多 维 模型 ,分析 服 务 就 要 从 关系 数据 
库 中 读 入 数据 ,按照 多 维 数据 集结 构 的 要 求 进行 分 组 汇总 ,此 时 需要 数据 满足 以 下 一 致 性 
规则 : 无 空 值 (null) 和 无 效 值 (invalid) ,参照 完整 .不 允许 删除 事实 表 中 的 行 。 

维 有 3 种 类 型 : 常规 维 、 父 子 维和 具有 层次 结构 的 维 。 表 示 常 规 维 的 维 表 通 常 有 侦 
数 个 编码 和 名 称 相对 应 的 列 。 父 子 维 与 常规 维 不 同 的 是 ,其 维 表 只 有 3 列 , 其 中 两 列表 达 
了 父子 关系 。 例 如 ,会 计 科目 中 包含 3 列 : 科目 编码 ,科目 名 称 、 上 级 科目 编码 。 其 中 , 科 
目 编码 和 上 级 科目 编码 两 列 中 包含 了 父子 关系 。 

多 维 数据 模型 对 数据 的 要 求 有 

(1) 度量 值 必须 是 数值 型 。 因 为 只 有 数值 型 列 , 才 能 被 计算 汇总 。 在 Access 中 , 数 
值 型 数据 类 型 有 数字 型 和 货币 型 。SQL Server 中 的 数值 型 数据 有 bigint、int、smallint、 
tinyint ,numeric decimal、 smallmoney money \real 和 float 。 

(2) 事实 表 和 维度 表 间 具有 参照 关系 的 列 必须 为 相同 数据 类 型 。 

(3) 维 成 员 是 字符 型 。 

(4) 时 间 维 也 是 常规 维 ,其 对 应 的 列 必须 是 日 期 时 间 型 。Access 中 的 列 数据 类 型 选 
“日 期 /时 间 ”。SQL Server 中 的 列 数据 类 型 选择 smalldatetime 或 者 datetime。 


5.1 多 维 分 析 案 例 一 一 延期 纳税 


按照 税收 征管 法 及 实施 细则 规定 ,只 有 当 企业 出 现 以 下 情况 时 ,税务 机 关 才 能 批准 企 
业 延 期 纳税 : 因 不 可 抗力 ,导致 纳税 人 发 生 较 大 损失 ,正常 生产 经 营 活动 受到 较 大 影响 
的 ;当期 货币 资金 在 扣除 应 付 职工 工资 社会 保险 费 后 ,不 足以 缴纳 税 款 的 。 本 案例 的 审 
计 目 标 就 是 查证 有 无 非法 批准 企业 延期 纳税 。 

审 前 调查 得 知 , 某 市 国税 局 所 属 各 区 县 的 延期 纳税 审批 数据 全 部 集中 在 市 局 的 数据 
库 服务 器 中 。 通 过 终端 查询 和 后 台 转 换 采 集 了 数据 ,并 进行 了 代码 转换 ,最 后 将 其 导入 
Access 数据 库 中 : X 市 国税 局 批准 延期 纳税 . mdb( 图 5-2)。 其 中 有 3 个 表 : 延期 纳税 批 
件 、 税 务 机 关 代 码 和 征收 项 目 代 码 。3 个 表 的 表 结 构 及 代表 性 或 全 部 数据 如 下 。 
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延期 纳税 批件 表 : 
字 展 名 称 要 所 关 型 说 明 
组 税 人 识别 号 文本 
征收 项 目 代码 文本 
所 属 期 起 日 萌 / 时 间 
所 属 期 目 日 期/ 时 间 
税额 数字 
税务 机 关 代 码 文本 
审批 日 期 目 戎 /时 间 
纳税 人 各 称 本 
税务 机 关 代 码 表 : 
了 数据 美 型 说 明 
税务 机 关 代码 | 文本 
税务 机 关 名 称 | 文本 
征收 项 目 代 码 表 : 
[亲友 2 了 称 | 次 控 奖 玉 1 设 明 | 
文本 | 
征收 项 目 名 称 文本 


5-2 X 市 国税 局 批准 延期 纳税 数据 库 


审计 人 员 希 望 以 图 5-3 所 示 方 式 在 不 同 维 上 浏览 数据 : 指定 所 有 或 某 个 征收 项 目 , 列 
出 各 区 (县 7 税务 机 关 在 各 年 度 或 者 某 年 度 各 月 的 审批 延期 纳税 额 情况 ,并 对 可 疑 数据 项 
可 以 立即 调 出 其 在 延期 纳税 批件 表 中 的 相关 行 。 
em 以 :| 


钻 取 数据 ( 前 1000 行 ) 


所 属 骨 起 | 所 属 骨 止 |。 税 实 | 税务 机 关 代码 | 审批 日 天 纳 菩 人 和 名称 征收 项 目 
3 2003-1-1 2003-1-31| 4000000 2810000 “2003-2-17 某 某 大 陆 钢铁 有 限 公司 | 1 


February March [ Apnl 
119,641.79377 78,849,784 51 26,292,887. 
36,667,777.54 850,.434 
238,084.65 1.000.00000 
200,000.00 
1931.16449 45620650 
466408121 2936.264. 
789.54000 
800.00000 49169683 4576941 
3,668,989.51 1528,174. 
14,300.000.00. 56.140.536.49 15041.511.09| 293.55830 
51.342.01875, 241.51405915， 5.000.000.00 5.000,000. 
12.252,.668.62 873,65478 6.849,502. 
166.990.534.57 473.324780.67 3585099321| 89.058.455.12 51.23439 2.265.443. 
1420457957 639644691 392.347.12 
4918104827 131.55036252 22138.544.09 25,555,213.32 ba 
» 


5-3 在 不 同 维 上 浏览 数据 


以 Microsoft Visual Studio 为 开发 工具 ,以 Microsoft Analysis Services 为 分 析 服 务 ， 
以 Microsoft Excel 为 客户 端 工具 .建立 和 浏览 多 维 分 析 模 型 的 过 程 如 下 。 

首先 以 “Microsoft Jet 4.0 OLE DB Provider” 作 为 驱动 程序 定义 分 析 服 务 与 “X 市 国 
税 局 批准 延期 纳税 . mdb” 的 数据 源 。 其 中 ,延期 纳税 批件 为 事实 表 ,征收 项 目 代 码 和 税务 
机 关 代 码 为 维 表 。 
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然后 定义 事实 表 和 维 表 之 间 的 参照 关系 如 图 5-4 所 示 。 多 维 分 析 模 型 中 的 各 个 表 必 
须 定义 主键 。 如 果 在 数据 源 中 没有 定义 , 则 需 定 义 逻 辑 主键 。 


早 序 二 

i 6 关 人 人 ELE 

a | 税务 机 关 代 码 ELEESN 

一 -一 -一 纳税 人 识别 号 时 税务 机 关 代码 
Basa 有 ii 


5-4 事实 表 和 维 表 之 间 的 参照 关系 


接 下 来 设置 “延期 纳税 批件 ”为 事实 表 , 并 把 其 中 的 “税额 ”设置 为 多 维 数据 集中 的 一 
个 度量 值 。 事 实 表 参照 的 外 键 表 作为 维 表 。 多 维 数 据 模型 如 图 5-5 所 示 。 该 模式 是 一 个 
星 型 架构 。 标 题 条 是 黄色 的 表 是 事实 表 ; 标 题 条 是 蓝 色 的 表 是 维 表 。 
| | 维度 用 法 | 多 计 革 | 可 ft | 好 扫 作 | 多 分 | 阳 宗 人 | 印 冯 术 | 蝙 副 # | 风 浏 吕 


印 避 | 名 间 四 "| 安 苏 |X* | 回国 | 风 人 -名 
小 据 视图 


息 由 项 目 代 码 本 征收 项 目 


征收 项 目 代码 
征收 项 目 名 称 


7 市 国税 局 批准 延期 纳税 
二 税务 机 关 
田 讶 各 lk 项 目 


是 税务 机 关 代码 
税务 机 关 名 称 


图 5-5 多 维 数据 模型 


让 分 析 服 务 处 理 该 多 维 数据 模型 后 ,就 可 以 按照 图 5-3 所 示 形 式 浏览 数据 了 。 增 
加 “审批 日 期 " 维 ,可 按照 “审批 日 期 "重新 进行 处 理 和 浏览 。 若 要 通过 “审批 日 期 "实现 
按 年 、 按 月 、 按 日 期 进行 数据 浏览 , 则 要 创建 维 的 级 别 实现 此 目标 。 在 维 上 可 以 定义 多 
个 级 别 ,如 “审批 日 期 " 维 的 级 别 可 以 有 年 、 季 度 、 月 份 、 星 期 .日 期 等 。 每 个 级 别 一 般 有 
若干 成 员 , 如 “星期 "级 别 中 的 成 员 有 星期 一 、 星 期 二 、 星 期 三 ,星期 四 、 星 期 五 .星期 六 
和 星期 日 “月 份 ”级 别 中 的 成 员 有 1 月 .2 月 .3 月 .4 月 .5 月 .6 月 .7 月 .8 月 .9 月 、 
10 月 .11 月 .12 月 ;季度 ”级别 中 的 成 员 有 1 季度 、2 季度 、3 季度 、4 季度。 通常 , 维 的 
所 有 成 员 组 成 了 一 个 层次 结构 。 图 5-6 以 时 间 维 为 例 展示 了 维 的 级 别 以 及 各 级 别 的 成 
员 ( 和 矩形 框 ) 。 


坤 二 分 上 析 : 内 的 国 到 内 井 声 


年 季度 月 份 日 
2015 年 1 季度 ] 月 1 日 
2 月 2 日 
3 月 3 日 
2 季度 得 

3 季度 

4 季度 

2016 年 
图 5-6 级 别 


在 多 维 数据 集 浏览 器 窗口 可 观察 指定 所 有 或 某 个 税务 机 关 、 指 定 所 有 或 某 个 征收 项 
目 在 各 个 时 间 维 级 别 (年 ,月 ) 上 的 税额 (度量 值 , MeasuresLevel) 情 况 。 例 如 ,双击 2012 
年 ,就 展开 了 该 年 的 下 级 维度 (月 )。 

又 如 ,从 “征收 项 目 ” 维 的 下 拉 列 表 中 选择 “企业 所 得 税 ”, 可 以 发 现 2012 年 和 2014 年 
所 有 税务 机 关 没 有 征收 企业 所 得 税 ,2013 年 的 企业 所 得 税 征收 集中 在 4 月份 和 10 月份。 
由 此 可 见 , 通 过 多 维 观 察 数 据 ,审计 人 员 可 以 很 容易 发 现 一 些 线索 。 例 如 ,可 以 看 到 不 少 
税额 为 整数 ,而 纳税 人 应 该 缴纳 的 税额 很 少 出 现 整数 ,尤其 工 市 国家 税务 局 从 2013 年 2 
月 起 连续 出 现 审批 金额 为 整数 (35400000) 的 情况 ,这 是 一 条 重要 审计 线索 。 

增加 “纳税 人 ?维度 ,并 通过 * 钻 取 ” 操 作 可 以 发 现 ,L 市 国税 局 连续 对 “ 某 某 大 陆 钢 铁 
有 限 公司 ”进行 批 缓 。 采 取 同 样 的 方法 ,还 可 以 发 现 其 他 涉嫌 企业 。 通 过 延伸 审计 ,很 容 
易 确认 国税 局 的 审批 行为 是 否 恰当 。 

通过 Excel 数据 透视 表 从 不 同 的 角度 查看 数据 。 数 据 透视 表 的 名 字 来 源 于 它 具 有 
“透视 "数据 的 能 力 ,这 使 其 成 为 非常 强大 的 数据 分 析 工 具 。 通 过 Excel 浏览 延期 纳税 多 
维 数据 集 的 步 又 如 下 。 

创建 Excel 数据 透视 表 。 单 击 Excel* 数 据 ?菜单 ,选择 * 自 其 他 来 源 ” 命 令 , 然 后 选择 
“来 自分 析 服 务 ”, 设 置 分 析 服 务 器 名 称 为 “.”, 表 示 本 地 服务 器 。 在 “选择 数据 库 和 表 ” 对 
话 框 中 选择 数据 库 “ 延 期 纳税 ”。 设 置 Excel 进行 数据 库 连 接 的 文件 名 字 , 单 击 “ 完 成 ” 按 
钮 ,此 时 Excel 如 图 5-7 所 示 。 

从 图 5-7 中 可 以 看 到 ,“ 数 据 透 视 表 字 段 列表 ”中 列 出 了 多 维 数据 集中 的 3 个 维度 ( 审 
批 日 期 ,税务 机 关 和 征收 项 目 ) 和 一 个 度量 值 (税额 )。 通 过 把 维度 拖 放 到 下 方 的 3 个 不 同 
区 域 ( 行 标签 , 列 标签 和 报表 筛选 ) 建 立 透 视 表 。 

Excel 的 优势 在 于 , 它 可 以 将 数据 透视 表 和 数据 透视 图 联动 展示 。 在 Excel 中 选择 一 
个 新 的 工作 单 (sheet) 或 者 新 建 一 个 工作 单 。 在 “数据 ”功能 区 中 选择 “ 现 有 连接 ”。 从 中 
选择 先前 建立 的 “X 市 国税 局 批准 延期 纳税 ”, 在 导入 数据 对 话 框 中 选择 “数据 透视 图 和 数 
据 透 视 表 ”, 单 击 “ 确 定 ” 按 钮 后 ,在 Excel 工作 单 上 既 出 现 了 透视 表 区 域 ( 左 上 角 ) ,又 出 现 
了 透视 图 区 域 (中 间 空 白 处 )。“ 数 据 透 视 表 字段 列表 ”的 上 半 部 分 列 出 了 来 自 多 维 数据 集 
的 度量 值 和 维度 ;其 下 半 部 分 是 数据 透视 表 或 者 数据 透视 图 的 参数 设置 ,如 图 5-8 所 示 。 
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5-8 数据 透视 图 


如 果 单 击 数据 透视 图 区 域 , 则 显示 “数据 透视 图 筛选 窗 格 ”, 窗 格 中 包括 “报表 筛选 
“ 轴 字 段 (分 类 )”“ 图 例 字 段 (系列 )”" 和 *“ 汪 数值 ”; 如 果 单 击 数 据 透视 表 , 则 相应 “ 轴 字段 (分 
类 )” 变 成 了 “ 行 标签 ”, 相 应 “图 例 字 段 ( 系 列 )” 变 成 了 “ 列 标签 ”。 这 个 对 应 变化 反映 了 数 
据 透视 图 和 数据 透视 表 间 的 一 致 性 : 数据 透视 表 中 的 行 标签 对 应 于 数据 透视 图 的 轴 字 


审 直 分析: 从 类 芭 到 大 数据 


段 ;数据 透视 表 的 列 标签 对 应 于 数据 透视 图 的 图 例 字段 。 

在 “选择 要 添加 到 报表 的 字段 "中 选择 度量 值 “ 税 额 ”, 该 度量 值 就 出 现在 “> 数值” 框 
中 ,意思 是 在 图 中 显示 对 该 度量 值 的 各 种 汇总 。 如 果 想 按 2013 年 度 观察 各 税务 机 关 批 组 
情况 ,就 把 “审批 日 期 拖 放 到 * 轴 字段 (分 类 )”, 把 “税务 机 关 ? 拖 放 到 “图 例 字段 ”。 右 击 数 
据 透视 图 的 空白 区 域 ,可 选择 图 表 类 型 ,如 条 形 图 .折线 图 等 。 


5.2 多维 数据 集 的 设计 


多 维 数据 集 (CUBE) 是 数据 源 、 数 据 源 视图 、 维 度 、 度 量 值 和 计算 列 的 总 称 。 多 维 数 
据 集 的 模型 设计 一 般 分 4 个 步骤 : 设计 概念 模型 .设计 度量 值 . 设 计 维度 .设计 事实 表 和 
维 表 。 

概念 模型 即 期 望 展现 的 业务 目标 ,如 各 个 税务 机 关 延 期 纳税 审批 合法 情况 ,这 就 是 一 
个 目标 。 目 标 要 体现 出 某 一 方面 的 各 分 析 角度 ( 维 ) 和 统计 数值 型 数据 (度量 值 ) 之 间 的 关 
系 。 例 如 ,从 日 期 税务 机 关 、 征 收 项 目 3 个 角度 观察 延期 纳税 审批 金额 。 

建立 多 维 模型 的 关键 是 度量 值 的 选取 、 维 的 选取 、 维 级 别 设 计 、 维 成 员 属 性 的 设计 。 

从 概念 模型 中 确定 度量 值 ,度量 值 是 可 以 被 分 组 汇总 的 数值 列 , 如 审批 金额 。 在 确定 
了 度量 值 之 后 ,审计 人 员 要 考虑 不 同 维度 下 度量 值 的 聚合 情况 ,通常 采用 “最 小 粒度 原 
则 ”, 即 将 度量 值 的 粒度 设置 到 最 小 。 

例如 ,假设 目前 的 延期 纳税 数据 最 小 记录 到 日 . 即 数据 库 中 记录 了 每 一 天 的 延期 纳税 
审批 业务 。 如 果 审 计 人 员 在 未 来 的 数据 分 析 中 只 需要 精确 到 月 ,那么 在 数据 采集 转换 时 
按 月 形成 事实 表 的 行 , 此 时 ,多 维 数据 集中 度量 值 的 粒度 就 是 "月 ”。 如 果 不 能 确认 将 来 的 
分 析 需 求 在 时 间 上 是 否 需要 精确 到 月 ,那么 就 需要 遵循 “最 小 粒度 原则 ”, 在 事实 表 中 保留 
每 一 天 的 数据 ,以 便 日 后 对 “天 ”进行 分 析 。 

维 是 指数 据 分 析 的 各 个 角度 。 能 够 作为 维度 的 列 具 有 对 度量 值 的 分 组 汇总 能 力 。 也 
就 是 说 ,这 些 列 可 放 在 SQL 查询 语句 的 ORDER BY 子 句 中 。 例 如 ,希望 按照 日 期 ,或 者 
按照 税务 机 关 , 或 者 按照 征收 项 目 进 行 分 析 , 那 么 这 里 的 日 期 .税务 机 关 , 征 收 项 目 就 是 相 
应 的 维 。 基 于 不 同 的 维 , 可 以 看 到 各 度量 值 的 汇总 情况 ,也 可 以 基于 所 有 的 维 进行 交叉 
分 析 。 

这 里 首先 要 确定 维度 的 层次 (hierarchy) 和 级 别 (level) 。 例 如 ,在 时 间 维 度 上 ,按照 
“年 -季度 -月 ”形成 了 一 个 层次 ,其 中 “年 “季度 ”月 ”成 为 这 个 层次 的 3 个 级 别 ; 同 理 , 当 
建立 征收 项 目 维度 时 ,可 以 将 “征收 项 目 大 类 -征收 项 目 子 类 -征收 项 目 ” 划 为 一 个 层次 ,其 
中 包含 “征收 项 目 大 类 ”征收 项 目 子 类 ”征收 项 目 ”3 个 级 别 。 

将 3 个 级 别 分 别 对 应 维 表 中 的 3 个 列 。 也 可 以 使 用 3 张 表 ,分 别 保存 征收 项 目 大 类 、 
征收 项 目 子 类 、 征 收 项 目 3 部 分 数据 ,此 时 便于 各 级 别 属性 设计 。 

被 审 单位 提供 了 大 量 数据 ,里 面 是 一 笔 笔 凭证 记录 一 笔 笔 审批 记录 ,等 等 。 那 么 ,这 
些 记录 是 审计 人 员 将 要 建立 的 事实 表 的 原始 数据 , 即 关于 某 一 主题 的 事实 记录 表 。 

事实 表 和 维 表 是 多 维 模型 中 的 两 个 基本 概念 。 事 实 表 是 数据 分 析 对 应 的 主要 数据 
项 ,一 般 是 企业 内 的 某 项 业务 或 某 个 事件 ,如 延期 纳税 批件 。 事 实 表 中 的 事实 一 般 具有 数 
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据 特性 和 可 加 性 ,这 种 特征 对 于 审计 分 析 而 言 是 非常 重要 的 。 在 审计 分 析 中 ,审计 人 员 关 
心 的 通常 不 是 单一 的 一 行 数据 ,而 是 按 不 同 角度 和 粒度 的 汇总 数据 。 度 量 值 是 所 分 析 的 
多 维 数据 集 的 中 心 值 ,是 基于 多 维 数据 集 的 事实 表 中 的 一 列 。 

维 表 中 包含 的 一 般 是 描述 性 的 文本 信息 ,这些 文 本 信息 将 成 为 事实 表 的 分 组 条 件 , 如 
按 税务 机 关 分 类 查询 延期 纳税 审批 金额 ,或 按 月 观察 延期 纳税 金额 变化 趋势 等 。 维 表 中 
的 维 属 性 应 该 具体 明确 ,体现 出 维 层次 的 划分 ,能 够 成 为 分 析 型 查询 的 约束 条 件 。 

在 多 维 模型 中 ,事实 表 的 行 称 为 事实 ,一 般 含 有 数值 列 或 其 他 可 以 进行 计算 的 数据 。 

事实 表 中 除了 各 维 外 键 和 各 度量 数据 ,不 应 该 存在 元 余 描述 性 信息 , 即 符合 “ 瘦 高 原 
则 ”, 即 要 求 事实 表 数 据 行 数 尽量 多 (粒度 最 小 ) ,而 描述 性 信息 尽量 少 。 

多 维 数据 模型 一 般 含 有 一 个 事实 表 和 一 组 维 表 , 形 成 最 常见 的 星 形 模式 。 在 星 形 模 
式 中 ,事实 表 居中 ,多 个 维 表 呈 辐 射 状 分 布 于 其 四 周 ,并 与 事实 表 连 接 。 

星 形 模式 虽然 是 一 个 关系 模型 ,但 是 它 不 是 一 个 规范 化 的 模型 。 在 星 形 模式 中 ,维度 
表 被 故意 地 非 规范 化 了 ,这 是 星 形 模式 与 OLTP 系统 中 的 关系 模式 的 基本 区 别 。 

采用 星 形 模式 设计 的 数据 仓库 的 优点 是 ,由 于 数据 的 组 织 已 经 过 预 处 理 ,所 以 查询 访 
问 效率 较 高 。 对 于 非 计 算 机 专业 的 用 户 而 言 , 星 形 模式 比较 直观 ,通过 分 析 星 形 模式 ,很 
容易 进行 各 种 分 析 。 

在 实际 应 用 中 , 随 着 事实 表 和 维 表 的 增加 和 变化 , 星 形 模式 会 产生 多 种 衍生 模式 ,其 
中 包括 雪花 模式 。 雪 花 模 式 是 对 星 形 模式 维 表 的 进一步 层次 化 ,将 某 些 维 表 扩 展 成 事实 
表 。 雪 花 模 式 的 维 表 是 基于 范式 理论 的 ,通常 部 分 表 满 足 第 三 范式 。 在 某 些 情况 下 ,雪花 
模式 的 形成 是 由 于 星 形 模式 在 组 织 数据 时 ,为 减少 维 表层 次 和 处 理 多 对 多 关系 而 对 数据 
表 进 行规 范 化 处 理 后 形成 的 。 

多 维 模 型 允许 审计 人 员 方 便 地 从 各 个 角度 观察 数据 ,而 不 必 设 计 SQL 语句 组 合 不 同 
的 条 件 去 查询 。 例 如 ,“ 延 期 纳税 "案例 中 的 多 维 模型 如 图 5-9 所 示 。 
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图 5-9 “延期 纳税 "案例 中 的 多 维 模 型 


审 动 分 析 : 从 其 和 针 到 类 数 揭 


该 模型 中 被 观察 的 数据 是 税额 (虚线 交点 上 ) ,这 些 数据 被 组 织 到 三 维 空间 : 税务 机 
关 、 时 间 和 征收 项 目 。 选 定 某 个 征收 项 目 , 在 平面 上 就 呈现 出 该 征收 项 目下 各 个 税收 机 关 
在 各 个 时 间 ( 年 月 ) 点 上 的 税额 情况 。 对 疑点 税额 .可 以 通过 钻 取 提 取 底 层 明 细 数 据 。 

分 析 服 务 并 不 验证 参照 完整 性 。 如 果 多 维 数据 集 的 事实 表 含有 不 存在 的 外 键 , 那 么 
对 这 些 行 不 了 予 处 理 。 数 据 的 不 完整 ,可 能 导致 分 析 结 果 错 误 。 

例如 ,“ 延 期 纳税 "案例 中 有 一 个 事实 表 ( 延 期 纳税 批件 ) 和 一 个 维 表 (征收 项 目 代码 )。 
其 中 ,“ 延 期 纳税 批件 ” 表 中 的 “征收 项 目 代码 ” 列 引 用 了 “征收 项 目 代码 ” 表 中 的 “征收 项 目 
代码 ”。 假 设 “ 延 期 纳税 批件 ” 表 中 存在 征收 项 目 代 码 为 404 和 410 的 行 ,而 在 “征收 项 目 
代码 ? 表 中 并 没有 代码 为 404 或 410 的 行 。 这 种 情况 称 为 引用 不 完整 。 如 果 验 证 数据 时 
发 现 有 这 类 问题 ,就 需要 对 不 完整 的 数据 进行 补充 。 

可 以 采用 如 下 的 SQL 语句 进行 引用 完整 性 验证 。 

SETIEICT DISTINCT 征 收 项 目 代码 


FROM 延期 纳税 批件 
WEHEFE 征 收 项 目 代码 Nor IN(sErpcz 征 收 项 目 代码 FECM 征 收 项 目 代码 ) 


一 般 来 说 ,最 好 在 建立 多 维 数据 集 前 ,通过 主键 约束 和 外 键 约束 先 建立 事实 表 和 维 表 
之 间 的 参照 完整 性 约束 。 一 旦 建立 了 参照 完整 性 约束 ,SQL Server 就 会 自动 发 现 违 反 约 
束 的 行 , 并 提出 警告 。 

只 有 有 针对 性 地 采集 数据 ,根据 多 维 数据 集 对 数据 的 要 求 进行 正确 地 清洗 和 转换 ,并 
验证 数据 的 真实 性 和 完整 性 ,才能 顺利 地 进行 多 维 分 析 , 发 现 审计 线索 和 证 据 。 


5.3 多维 分 析 案 例 一 一 烟草 公司 纳税 


假设 业务 目标 是 确认 A 市 烟草 公司 销售 额 与 纳税 的 一 致 性 。 

审计 人 员 需 要 观察 A 市 及 下 属 各 县 级 烟草 公司 各 日 期 各 品牌 的 销售 数量 \、 销 售 额 、 
税额 。 据 此 目标 ,首先 确定 度量 值 。 此 主题 中 度量 值 涉及 3 个 : 销售 数量 、 销 售 额 税额 。 
接 下 来 确定 事实 数据 的 粒度 。 从 被 审 单位 了 解 到 ,形成 销售 事实 的 操作 型 业务 数据 以 天 
为 单位 存 人 数据 库 , 即 销售 日 期 精确 到 天 。 按 照 * 最 小 粒度 原则 ”保持 此 粒度 的 数据 。 由 
于 审计 数据 分 析 主 题 中 要 求 从 各 县 级 烟草 公司 、 各 日 期 .各 品牌 进行 分 析 , 所 以 烟草 公司 、 
时 间 和 品牌 自然 形成 了 待 构建 的 多 维 数据 集 的 维 。 通 过 上 面 的 分 析 , 已 经 初步 形成 了 星 
形 模式 的 多 维 数据 集 概念 模型 ,如 图 5-10 所 示 。 


按照 全 部 或 者 某 个 


指定 全 部 或 者 某 个 卷 烟草 公司 、 在 各 日 期 粒度 年 、 
月 、 日 ) 上 查看 销售 售 额 、 税 额 。 
日 期 维 
度量 值 : 来 自 事实 表 
图 5-10 概念 模型 


可 


ER 


5.3.1 创建 多 维 数据 集 


接 下 来 根据 被 审 单位 采集 电子 数据 ,并 经 过 清洗 转换 和 验证 后 形成 一 个 事实 表 和 两 
个 维 表 ,各 表 的 结构 如 图 5-11 所 示 。 


销售 事实 表 
字段 名 称 数据 类 型 

公司 ID 文本 
部 门 ID 文本 
销售 单 标识 文本 
客户 标识 文本 
卷烟 代码 文本 
计量 单位 文本 
销售 数量 (条 ) 数字 
销售 金额 ( 价 税 合计 ) 数字 

了 额 数字 
销售 日 期 日 期 /时 间 
烟草 公司 表 
公司 ID 文本 
公司 名 称 文本 
上 级 公司 ID 文本 
省 ID 文本 
地 区 ID 文本 
卷烟 品牌 表 

字段 名 称 数据 类 型 
卷烟 代码 文本 
卷烟 名 称 文本 
5-11 表 结 构 


第 一 步 ,启动 Visual Studio ,新 建 一 个 多 维 分 析 项 目 , 命 名 为 “A 市 烟草 公司 ”。 

第 二 步 ,新 建 数 据 源 。 在 “解决 方案 资源 管理 器 ”中 右 击 “数据 源 ”, 选 择 “ 新 建 数据 
源 ”。 在 “选择 如 何 定义 连接 "对话 框 中 单 击 “ 新 建 "。 在 “连接 管理 器 ”对 话 框 中 首先 选择 
“提供 程序 ”, 在 其 右 侧 的 下 拉 列 表 中 选择 “Microsoft Jet 4.0 OLE DB Provider”, 这 是 
Access 的 驱动 程序 。 单 击 “ 浏 览 ” 按 钮 ,设置 存放 源 数据 的 Access 数据 库 文 件 位 置 。 单 
击 “ 确 定 ” 按 钮 , 回 到 “如 何 定义 连接 "对话 框 。 设 置 以 “继承 ”方式 登录 ,最 后 把 数据 源 命名 
为 “A 市 烟草 公司 ”。 

第 三 步 ,新 建 数据 源 视图 。 在 “解决 方案 资源 管理 器 "中 右 击 “数据 源 视 图 ”, 选 择 “ 新 
建 ”, 在 数据 源 视 图 向 导 的 “选择 数据 源 ” 对 话 框 ,保持 默认 的 关系 数据 源 。 单 击 “ 下 一 步 ” 
按钮 。 在 “名 称 匹配 ”对 话 框 保持 默认 设置 。 在 “选择 表 和 视图 ”, 单 击 *>> ”按钮 ,选择 “可 
用 对 象 ”列表 中 的 所 有 表 到 右 侧 列表 。 

最 后 把 数据 源 视 图 命名 为 “A 市 烟草 公司 销售 数据 ”。 在 自动 打开 的 数据 源 视图 设 
计 器 窗口 定义 逻辑 主键 和 表 间 关系 ,最 后 的 结果 如 图 5-12 所 示 。 注 意 ,一 定 通 过 把 * 上 级 
公司 ID” 拖 放 到 “公司 ID? 建 立 烟草 公司 间 的 自 引 用 关系 。 这 个 关系 是 多 维 数据 集 向 导 生 
成 父子 维度 的 关键 信息 。 从 概念 上 看 ,部门 之 间 的 从 属 关 系 形成 了 父子 关系 ,一 个 成 员 有 具 
有 父子 关系 的 维度 能 够 帮助 观察 者 轻松 地 逐 级 展开 进行 观察 。 所 以 ,一 个 维度 ,如 果 其 成 


二 动人 邹 本: 内 并 用 司 风 久 癸 


员 具 有 父子 关系 性 质 , 就 适合 作为 父子 维 。 


国 烟草 公司 表 /一 一 一 | 日 销售 事实 数据 表 | 一 一 ， | 加 阁 遇 品牌 表 
?公司 加 公司 ID 站 卷烟 代码 
公司 名 称 部 门 m 卷烟 名 称 
上 级 公司 ID 销售 单 标识 
省 D 客户 标识 
地 区 ID 卷烟 代码 
计量 单位 
销售 数量 条 ) 
销售 金额 ( 价 税 合计 ) 
销售 税额 
销售 日 期 


图 5-12 数据 源 视图 


第 四 步 , 新 建 多 维 数据 集 。 古 击 “ 多 维 数据 集 ” 文 件 夹 ,选择 “ 新 建 ”, 向 导 通过 数据 源 
链接 从 Access 数据 库 A 市 烟草 公司 销售 数据 . mdb 中 读 取 出 了 3 个 表 : 烟草 公司 表 、 卷 
烟 品 牌 表 和 销售 事实 数据 表 。 选 择 “ 销 售 事实 数据 表 ” 作 为 本 多 维 数据 集 的 度量 值 组 表 。 
下 一 步 要 指定 在 事实 表 中 哪些 数字 列 用 来 作为 度量 值 。 向 导 从 数据 库 中 找到 了 3 个 数字 
列 : 销售 数量 (条 ) 、 销 售 金额 ( 价 税 合计 ) 和 销售 税额 。 所 有 数字 列 作为 度量 值 。 下 一 步 
定义 多 维 数据 集 的 维 : 在 “选择 新 维度 ”对 话 框 保持 默认 设置 。 最 后 把 多 维 数据 集 命名 为 
“A 市 烟草 公司 销售 数据 ”。 

第 五 步 ,编辑 生成 的 维度 。 在 “解决 方案 资源 管理 器 "中 双击 “烟草 公司 ”维度 ,打开 维 
度 设计 器 ,在 “维度 结构 ”标签 页 单 击 “ 公 司 ID”, 在 其 属性 窗口 设置 NameColumn 属性 为 
“公司 名 称 ”。 

A 市 烟草 公司 下 属 18 个 县 级 销售 公司 ,县 级 公司 直接 面 对 零 售 商 。 各 单位 间 从 属 关 
系 可 通过 公司 代码 表 中 公司 ID 列 和 上 级 公司 ID 列 获取 。 这 种 存在 父子 关系 的 维 通 过 在 
数据 源 视 图 定义 的 自 引 用 关系 被 向 导 自 动 识别 ,创建 为 父子 维 。 单 击 “ 烟 草 公司 ” 维 的 “上 
级 公司 ID” 属 性 ,可 以 在 其 属性 窗口 中 看 到 其 用 法 属性 (Usage) 为 Parent。 采 取 同 样 的 步 
又 ,设置 “卷烟 代码 表 ” 维 的 NameColumn 的 属性 为 “卷烟 名 称 ”。 

第 六 步 , 新 建 日 期 维度 。 在 多 维 数据 集 设计 器 窗口 右 击 “销售 事实 数据 表 ”, 选 择 “ 浏 
览 ”, 观 察 到 日 期 列 从 2003 年 1 月 到 2003 年 12 月。 所 以 ,日 期 维度 的 设置 如 下 : 第 一 个 
日 历 日 为 2003 年 1 月 1 日 ;最 后 一 个 日 历 日 为 2003 年 12 月 31 日 ;时 间 段 为 年 .月 份 和 
日 期 。 最 后 指定 维 的 名 字 : 销售 日 期 。 单 击 “ 完 成 ”按钮 .然后 在 多 维 数据 集 设 计 器 中 把 
该 维度 添加 进来 。 

第 七 步 ,编辑 “维度 用 法 ”。 在 多 维 数据 集 设计 器 中 选择 “维度 用 法 ”标签 页 ,保持 默认 
的 公司 代码 和 卷烟 代码 维度 关系 不 变 ,定义 销售 日 期 维度 和 度量 值 组 列 的 关系 。 在 解决 
方案 资源 管理 器 中 展开 A 市 烟草 公司 的 数据 源 文件 夹 、 多 维 数据 集 文件 夹 和 共享 维度 文 
件 夹 ,可 以 发 现 已 经 创建 了 一 个 数据 源 、 一 个 多 维 数据 集 和 3 个 维 。 单 击 工具 栏 中 的 “全 
部 保存 ”按钮 。 

第 八 步 , 右 击 销售 多 维 数据 集 ,选择 “浏览 数据 *”。 此 时 ,审计 人 员 就 可 以 从 销售 公司 、 
销售 日 期 和 卷烟 名 称 3 个 维 观察 数据 ,把 握 总 体 了 。 
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5.3.2 在 Excel 中 浏览 该 多 维 数据 集 


第 一 步 ,通过 选择 “数据 ”功能 卡 * 自 其 他 来 源 ” 的 “来 自分 析 服务 "打开 数据 连接 向 导 ， 
选择 分 析 服 务 中 的 “人 A 市 烟草 公司 "多维 数据 库 。 

第 二 步 ,设置 数据 透视 图 的 “数值 "字段 为 “销售 金额 ( 价 税 合计 )”" 和 “销售 税额 ”, 分 类 
字段 为 “销售 日 期 ”展开 2003 年 各 个 月 份 ,观察 总 体 ,发 现 12 月 份 问题 最 大 ,如 图 5-13 
所 示 。 


图 5-13 观察 总 体 


第 三 步 ,12 月 份 的 问题 是 由 哪个 品牌 产生 的 呢 ? 接着 以 12 月 份 为 筛选 字段 ,设置 得 
选 ^December 2003”, 添 加 卷烟 品牌 为 分 类 字段 ,发 现 H532905( 黄 ) 的 问题 最 大 ,如 
5-14 所 示 。 

第 四 步 ,查找 是 哪 家 销售 公司 导致 的 异常 ? 以 H532905( 黄 ) 卷 烟 品 牌 作为 图 例 字 
段 ,以 烟草 公司 作为 分 类 字段 ,查找 到 底 哪 家 烟草 公司 导致 该 品牌 销售 税额 和 销售 金额 异 
常 。 由 于 卷烟 品牌 很 多 ,所 以 很 难 从 列表 中 选择 到 *H532905( 黄 )”, 此 时 我 们 希望 列 标签 
列表 是 有 序 的 ,这 样 就 方便 查找 特定 成 员 了 。 回 到 “卷烟 品牌 ”维度 设计 器 ,把 “卷烟 代码 ” 
属性 的 OrderBy 属性 值 由 默认 的 Key 修改 为 Name。 重 新 处 理 多 维 数据 集 。 如 果 出 现 错 
误 “ 处 理 时 找到 重复 的 属性 键 : 表 : 卷烟 品牌 , 列 : 卷烟 代码 , 值 340106”, 其 含义 是 在 卷 
烟 品 牌 维 表 中 含有 重复 键 值 *340106”。 打 开 Access 数据 库 , 在 “卷烟 代码 ” 列 上 设置 第 
选 : 值 等 于 “340106”, 发 现 有 重复 值 ,此 时 删除 其 中 一 行 即 可 。 
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挖掘 型 分 析 


传统 审计 思路 形成 的 来 源 主要 有 : 法 律 法 规 . 被 审计 单位 的 业务 逮 辑 ,数据 间 的 逻辑 
关系 、 被 审计 数据 与 外 部 相关 数据 的 映射 和 审计 经 验 等 。 数 据 挖掘 技术 的 发 展 和 应 用 为 
审计 思路 的 形成 提供 了 一 条 新 的 途径 : 让 计算 机 自动 地 或 者 半自动 地 从 海量 数据 中 发 现 
潜在 的 联系 或 者 规律 ,审计 人 员 再 对 计算 机 发 现 的 内 容 进行 确认 ,进而 发 现 审计 线索 ,这 
就 是 数据 挖掘 在 审计 实务 中 应 用 的 基本 思路 。 


6.1 数据 挖掘 


数据 挖掘 是 从 大 量 的 ,不 完全 的 \ 有 噪声 的 、 模 糊 的 、 随 机 的 数据 中 抽取 出 隐 含 在 其 中 
的 ,人 们 事先 不 知道 的 ,但 又 是 潜在 有 用 的 信息 和 


知识 的 过 程 。 获取 数据 
数据 挖掘 过 程 (图 6-1) 包 括 5 个 步骤 : 获取 数 / 、 
据 ,准备 数据 建立 模型 .评估 模型 和 应 用 模型 。 
获取 数据 指 的 是 从 被 审计 单位 取得 各 种 各 样 ”| 应 用 模型 准备 数据 
的 数据 ,包括 从 各 种 数据 库 服务 器 或 者 分 析 服 务 器 \ 7 
中 导出 的 数据 、Access 数据 库 、Excel 文件 .各 种 格 
式 的 文本 文件 .XML 文件 等 。 评估 模型 | _。 | 建立 模型 
准备 数据 指 的 是 对 数据 进行 清洗 转换 ,抽取 
和 验证 ,使 之 符合 数据 挖掘 模型 的 要 求 。 清 洗 指 对 图 6-1 数据 控 据 过程 


缺失 的 .重复 的 .无 效 的 \ 不 一 致 的 数据 进行 处 理 ， 

提高 数据 质量 ,并 统一 量 纲 。 还 有 一 种 清洗 情形 是 噪声 清除 ,如 * 币 种 ”, 当 大 多 数 事例 都 
是 人 民 币 或 者 美元 ,大 量 的 币 种 ,如 欧元 、 澳 元 等 没有 几 个 事例 。 这 种 情况 下 ,对 于 数据 挖 
掘 来 说 ,具有 很 少 事例 支持 的 属性 值 对 于 模式 发 现 没 有 什么 贡献 ,甚至 带 来 负面 影响 ,所 
以 可 以 作为 噪声 数据 清除 。 对 具有 连续 值 的 属性 , 则 可 以 通过 设置 最 小 值 和 最 大 值 清除 
稀疏 的 事例 。 转 换 包 括 数 据 类 型 转换 和 数据 内 容 转换 。 不 同 的 数据 源 使 用 的 数据 类 型 不 
同 ,例如 ,Access 中 对 于 字符 数据 使 用 “文本 ”类 型 ,而 SQL Server 中 使 用 CHAR 或 者 
VARCHAR。 需 要 选择 合适 的 映射 进行 转换 。 又 如 ,把 出 生日 期 转换 成 为 年 龄 就 属于 内 
容 转 换 。 同 一 个 实体 可 能 使 用 不 同 的 表示 。 也 就 是 说 ,同样 的 属性 值 , 可 能 有 不 同形 式 。 
例如 ,同样 的 一 所 学 校 “华北 电力 大 学 ”, 可 能 出 现 3 种 不 同 的 取 值 :“ 华 电 ”“ 华 北 电 力 ” 
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“华北 电力 大 学 ”, 需 要 把 这 些 值 转换 成 唯一 的 取 值 ,这 也 属于 内 容 转换 。 数 据 抽 取 就 是 选 
择 有 关系 的 表 、 视 图 .相关 的 字段 以 及 相关 的 行 。 一 般 要 对 数据 的 概率 与 统计 特征 做 一 般 
性 了 解 ,以 决定 挖掘 需要 抽取 的 行 数 。 验 证 是 指 通 过 检验 确认、 清洗 、 转 换 后 的 数据 与 之 
前 数据 的 一 致 性 以 及 数据 的 完整 性 。 例 如 ,在 固定 资产 表 中 存在 关系 : 资产 净值 十 累计 
折旧 一 资产 原 值 ,在 数据 准备 阶段 需要 对 这 类 关系 进行 验证 。 经 过 数据 准备 ,得 到 的 是 一 
个 事例 表 (case table) 和 多 个 舱 套 表 (nested table) 。 

把 全 部 事例 划分 成 两 个 子 集 : 训练 集 和 测试 集 。 训 练 集 也 称 为 学 习 集 ,是 分 析 服 务 
使 用 相关 的 学 习 算 法 获取 知识 的 过 程 。 数 据 挖 掘 的 结果 知识 是 隐 含 的 ,事先 未 知 的 、 潜 在 
有 用 的 信息 。 知 识 可 表示 为 概念 (concepts)、 分 类 (classification) 规则 (rules)、 规 律 
(regulations) ,模式 (patterns) 等 形式 。 有 的 知识 可 以 显 式 地 使 用 某 种 知识 表示 形式 表 
示 , 如 产生 式 ; 有 的 无 法 用 显 式 的 方法 进行 描述 ,如 用 神经 网 络 挖掘 出 的 模式 是 通过 连接 
权 值 体现 出 来 的 。 知 识 发 现 的 最 后 一 步 是 结果 的 表达 和 解释 ,该 步骤 负责 将 挖掘 的 模式 
用 更 容易 理解 的 方式 ,如 图 形 .自然 语言 和 可 视 化 技术 等 展现 在 用 户 面前 。 测 试 事例 集 用 
来 评估 模型 的 准确 性 。 

建立 模型 包括 识别 数据 挖掘 方法 .选择 挖掘 算法 .设置 算法 参数 .根据 挖掘 算法 选择 
设置 输入 属性 和 设置 输出 属性 ,指定 测试 数据 百分比 等 。 训 练 数据 挖掘 模型 是 一 个 机 器 
学 习 的 过 程 , 这 个 过 程 从 数据 中 抽取 出 了 知识 ,并 以 决策 树 .规则 等 形式 表示 这 些 知识 。 
数据 挖掘 分 析 模 型 包括 数据 挖掘 结构 和 数据 挖掘 算法 。 数 据 挖掘 结构 中 定义 了 作为 输入 
的 事例 表 ; 数 据 挖掘 算法 从 训练 集中 寻找 知识 ,算法 要 求 定 义 输入 列 和 预测 列 。 

设置 了 输入 列 和 输出 列 ,以 及 数据 挖掘 算法 后 ,数据 挖掘 模型 就 定义 好 了 。 建 立 一 个 
适合 业务 目标 的 数据 挖掘 模型 是 审计 数据 挖掘 成 功 的 关键 ,而 设置 合适 的 算法 参数 则 影 
响 模 型 的 处 理 效率 和 结果 的 可 靠 程 度 。 设 置 算 法 参数 要 求 对 算法 本 身 有 较 深 入 的 理解 。 
也 可 以 多 次 尝试 ,选择 最 优 的 参数 。 

用 来 进行 有 监督 式 数据 挖掘 的 数据 通常 被 随机 分 成 两 部 分 (通常 的 比例 是 70% 和 
30%) ,一 部 分 作为 训练 集 , 另 一 部 分 作为 测试 集 。 确 保 训 练 集 和 测试 集 的 随机 性 对 于 模 
型 的 准确 率 十 分 重要 。 可 以 使 用 随机 抽样 或 者 过 度 抽 样 减 小 数据 的 规模 ,以 减少 模型 处 
理 时 间 的 消耗 。 如 果 随 机 抽样 策略 导致 一 个 测试 集 正常 事例 和 欺诈 事例 的 分 布 不 同 , 则 
应 使 用 分 层 抽样 策略 ,以 确保 所 有 样本 都 服从 数据 原始 的 分 布 。 

抽样 (sampling) 就 是 从 组 成 某 个 总 体 的 所 有 事例 集合 中 按照 一 定 方式 抽出 部 分 事例 
的 过 程 。 简 单 随机 抽样 (simple random sampling) 是 概率 抽样 的 基本 形式 , 它 按照 等 概率 
原则 直接 从 N 个 事例 的 总 体 中 随机 抽取 个 组 成 样本 ;分 层 抽样 (stratified sampling) 将 
总 体 样本 按 其 属性 特征 (如 性 别 、 职 业 \ 年 龄 ,地域 ) 分 成 若干 类 型 或 层次 ,然后 在 各 个 类 型 
或 层次 中 采用 简单 随机 抽样 抽取 子 样本 ,最 后 将 子 样本 合 起 来 组 成 总 体 的 样本 。 其 特点 
是 ,通过 划 类 分 层 , 增 大 了 各 类 型 中 单位 间 的 共同 性 .容易 抽出 具有 代表 性 的 样本 。 该 方 
法 适用 于 总 体 情 况 复杂 .各 类 别 之 间 差 异 较 大 ,类 别 较 多 的 情况 。 分 层 抽样 的 优点 是 , 样 
本 代表 性 好 ,抽样 误差 小 ;过 度 抽样 就 是 加 大 样本 在 总 体 中 的 比例 。 因 为 在 样本 比例 太 小 
的 情况 下 ,如 果 直 接 采用 某 种 模型 (如 决策 树 、 神 经 网 络 等 ), 可 能 会 因为 数据 概率 太 小 而 
导致 模型 失效 ,这 种 过 度 抽 样 必须 谨慎 使 用 。 
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处 理 数 据 挖掘 模型 是 建立 模型 环节 的 最 后 一 步 。 处 理 的 过 程 是 让 计算 机 根据 所 设置 
的 数据 挖掘 模型 ,从 数据 中 发 现 审计 人 员 感 兴趣 的 知识 的 过 程 。 根 据 使 用 的 数据 规模 的 
不 同 以 及 算法 和 算法 参数 不 同 ,处 理 的 时 间 可 长 可 短 , 长 的 可 能 需要 一 两 天 , 短 的 只 需要 
几 分 钟 。 

评估 模型 指 通过 挖掘 准确 性 图 (Mining Accuracy Chart) 等 工具 ,使 用 测试 数据 评估 
模型 。 通 常 使 用 准确 性 、 可 靠 性 和 有 用 性 对 数据 挖掘 结果 进行 度量 。“ 准 确 性 ?是 模型 产 
生 的 结果 与 所 测试 数据 中 的 结果 一 致 性 程度 的 度量 。“ 可 靠 性 ?是 评估 数据 挖掘 模型 在 不 
同 测试 数据 集 上 测试 结果 的 一 致 性 度量 。 如 果 无 论 提供 什么 样 的 测试 数据 ,数据 挖掘 模 
型 的 准确 率 都 差不多 , 则 该 数据 挖掘 模型 是 可 靠 的 .“ 有 用 性 ?是 说 明 模型 产生 的 结果 是 
否 有 用 的 度量 。 如 果 经 过 评估 ,模型 的 准确 性 、 可 靠 性 和 有 用 性 能 够 被 接受 , 则 可 以 应 用 
该 模型 到 事例 集 上 进行 查询 。 这 个 阶段 往往 需要 结合 使 用 SQL 语句 。 

应 用 模型 指 把 模型 应 用 于 新 的 事例 集 。 

数据 挖掘 过 程 是 一 个 反复 的 过 程 , 每 一 个 步骤 如 果 没 有 达到 预期 目标 ,都 需要 回 到 前 
面 的 步骤 ,重新 调整 并 执行 。 


6.2 审计 数据 挖掘 分 析 


从 审计 角度 看 ,数据 挖掘 就 是 根据 事先 明确 的 审计 目标 ,对 被 审 单位 的 大 量 业 务 数据 
进行 分 析 ,揭示 其 中 潜在 的 逻辑 关系 和 规律 ,并 进而 形成 明确 而 有 效 的 审计 思路 的 过 程 。 
例如 ,银行 贷款 五 级 分 类 真实 性 情况 审计 。 由 于 种 种 原因 , 某 些 事实 上 的 不 良 贷款 (次 级 、 
可 疑 或 损失 ) 被 商业 银行 人 为 地 划 归 正常 贷款 分 类 (正常 或 关注 ) 中 。 按 照 传统 的 审计 思 
路 ,需要 与 被 审 单位 了 解 贷款 五 级 分 类 规则 ,然后 根据 被 审 单位 提供 的 规则 逐一 核实 各 笔 
贷款 的 分 类 是 否 正确 。 挖 掘 型 分 析 途 径 是 先 让 计算 机 从 被 审 单位 提供 的 大 量 可 信贷 款 数 
据 中 分 析出 贷款 五 级 分 类 规则 ,然后 使 用 该 规则 应 用 于 可 疑 贷款 数据 集 ,从 而 发 现 审 计 

数据 挖掘 途径 的 计算 机 审计 真正 难点 在 于 定义 业务 问题 ,这 需要 审计 人 员 了 解数 据 
挖掘 能 做 什么 ,从 而 提出 问题 。 当 数据 量 较 小 时 ,即使 审计 人 员 事 先 并 不 知道 数据 间 的 联 
系 和 规律 ,也 可 以 通过 简单 的 查询 和 分 析 进 行 把 握 , 无 须 数据 挖掘 。 当 数据 量 相当 庞大 ， 
使 用 SQL 查询 的 方法 和 多 维 分 析 的 方法 都 难以 发 现 数据 背后 隐藏 的 规律 时 ,利用 数据 控 
掘 就 显得 非常 必要 了 。 

实施 数据 挖掘 的 步骤 包括 定义 审计 业务 问题 .数据 准备 .数据 挖掘 、 结 果 分 析 。 

定义 审计 业务 问题 即 明确 指出 数据 挖掘 的 目标 。 例 如 ,让 计算 机 在 真实 贷款 事例 集 
上 自动 总 结 归纳 出 贷款 五 级 分 类 规则 。 数 据 准 备 包括 数据 采集 ,数据 清洗 和 数据 转换 。 

可 以 在 关系 型 数据 上 进行 数据 挖掘 ,也 可 以 在 多 维 数据 集 上 进行 数据 挖掘 。 数 据 挖 
掘 模型 设计 是 根据 数据 挖掘 的 目标 和 数据 特征 ,选择 合适 的 模型 。 建 立 一 个 适合 数据 挖 
气 算 法 的 分 析 模 型 是 数据 挖掘 成 功 的 关键 。 关 系 型 挖掘 模型 包括 事例 表 、 数 据 挖掘 算法 、 
事例 键 表 (包含 事例 键 列 的 表 ) 事例 键 列 、 输 入 列 ( 依 据 )、 可 预测 列 ( 结 果 ) 等 。OLAP 数 
据 挖掘 模型 包括 源 多 维 数据 集 、 数 据 挖掘 方法 ,将 分 析 的 事例 维和 级 别 、 最 初 的 预测 实体 、 
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训练 数据 等 。 预 测 实体 是 源 多 维 数据 集 的 一 个 度量 值 ,或 是 事例 级 别 的 一 个 成 员 属性 ,也 
可 以 是 另 一 个 维度 的 成 员 。 


6.3 数据 挖掘 算法 


数据 挖掘 有 分 类 (classification)、 聚 类 (clustering)、 关 联 (associate)、 序列 模式 
(sequence pattern) 等 问题 。 不 同 的 问题 由 不 同 的 算法 解决 。 

分 类 是 最 基本 的 数据 挖掘 方法 之 一 。 分 类 就 是 把 一 些 事例 映射 到 给 定 类 别 中 的 某 一 
个 类 别 中 的 过 程 。 实 施 映射 前 ,一 般 利用 一 定 的 分 类 算法 ,从 样本 中 计算 得 到 分 类 规则 ， 
再 依据 该 规则 在 另 一 组 事例 上 进行 类 别 的 划分 。 例 如 ,根据 信用 卡 支付 事例 判断 哪些 客 
户 具有 良好 的 信用 。 分 类 问题 的 特点 是 根据 事例 的 某 些 属性 ,估计 一 个 特定 属性 的 值 。 
常见 的 分 类 算法 有 朴素 贝 叶 斯 (Naive Bayes)、 决 策 树 (Decision Tree)、K 最 近邻 
(k-NearestNeighbor,kNN) ,神经 网 络 分 类 (Neural Networks)、 支 持 向 量 机 (Support 
Vector Machine,SVM) 等 。 通 常 将 所 有 数据 分 成 训练 集 和 测试 集 ,在 训练 集 上 得 到 模 
型 ,在 测试 集 上 得 到 准确 率 。 确 保 训练 集 和 测试 集 的 随机 性 对 于 模型 的 准确 率 十 分 重要 。 
为 了 避免 特殊 性 ,在 数据 挖掘 工具 中 使 用 交叉 检验 的 方法 。 在 这 种 方法 中 ,整个 数据 集 被 
等 分 成 10 个 子 集 , 称 为 小 包 (folds) ,每 一 小 包 都 作为 测试 集 , 其 余 的 包 作 为 训练 集 。 将 
10 个 试验 的 平均 结果 作为 最 终结 果 。 

聚 类 就 是 依据 样本 特征 将 事例 分 到 多 个 簇 中 ,使 得 同一 个 簇 中 的 事例 “相似 ”, 而 与 其 
他 得 中 的 事例 “不 相似 ”。 一 种 比较 直观 的 聚 类 做 法 是 先 选取 若干 事例 代表 (可 能 是 随机 
选择 ) ,然后 计算 其 他 事例 与 这 些 代表 的 距离 ,把 事例 划分 到 距离 最 近 的 代表 所 在 的 簇 中 。 
在 审计 数据 挖掘 中 ,不 属于 任何 簇 .或 者 事例 较 少 的 簇 ,往往 就 是 审计 疑点 。 常 见 的 聚 类 
算法 有 均值 (K-means)、 期 望 最 大 化 (EM)、 自 组 织 图 (SOM) 、 层 次 聚 类 (hierarchical 
clustering)、 相 蜡 和 矩阵 计算 (dissimilarity matrix calculation)、 模 糊 C- 均 值 (fuzzy 
C-means) ,围绕 中 心 点 划分 (partitioning around medoids) 等 。 

和 聚 类 非常 相关 的 数据 挖掘 问题 是 异常 检测 (outlier detection) 。 聚 类 是 相似 对 象 的 
分 组 ,然而 ,可 能 存在 一 些 对 象 不 属于 任何 聚 类 ,这 些 对 象 就 是 异常 对 象 。 根 据 不 同 的 业 
务 领域 ,这 些 异常 对 象 极 有 可 能 是 欺诈 。 

当 评 价 一 个 聚 类 模型 时 ,需要 考虑 以 下 几 方 面 内 容 : 各 个 聚 类 彼此 之 间 的 相似 程度 ; 
事例 属于 最 相似 聚 类 的 程度 ;是 否 存在 异常 记录 ; 某 个 聚 类 的 典型 记录 ( 聚 类 的 特征 ) ;不 
同 聚 类 之 间 的 差别 。 

散 点 图 用 来 分 析 各 个 事例 到 聚 类 中 心 的 距离 。 和 雷达 图 可 以 用 来 评估 不 同 聚 类 间 的 
距离 。 

关联 分 析 是 从 大 量 事务 数据 中 发 现 项 与 项 之 间 的 关联 ,是 早期 应 用 的 数据 挖掘 方法 
之 一 。 关 联 规则 模型 很 容易 理解 ,也 容易 实施 。 一 个 事务 中 包含 了 若干 项 (item) 。 关 联 
规则 指 这 些 项 之 间 隐 含 的 相互 关系 。 关 联 分 析 的 任务 是 发 现 项 间 的 关联 规则 。Apriori 
是 一 种 最 有 影响 的 挖掘 布尔 关联 规则 频繁 项 集 的 算法 ,是 一 种 基于 两 阶段 频 集 思想 的 递 
推算 法 ;FP-Tree 是 一 种 不 产生 候选 挖掘 频繁 项 集 的 算法 。 
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对 于 不 同业 务 领 域 ,可 通过 关联 工具 解决 的 业务 问题 有 : 什么 能 量 类 型 会 一 起 产生 ; 
病人 药物 和 治疗 效果 之 间 存 在 的 关系 ;哪些 基因 序列 通常 一 起 出 现 ; 哪 些 航班 经 常 一 起 延 
误 ;哪些 汽车 零件 经 常 一 起 发 生 故 障 等 。 

关联 规则 模型 很 容易 理解 ,但 是 往往 会 产生 大 量 无 价值 的 规则 。 

序列 模式 挖掘 就 是 要 找 出 序列 中 所 有 的 序列 模式 。 将 重点 放 在 发 现 项 之 间 的 一 定 的 
因果 关系 。 给 定 一 个 由 不 同 序列 组 成 的 集合 ,其 中 每 个 序列 由 不 同 的 元 素 按 顺序 排列 ,每 
个 元 素 由 不 同 项 目 组 成 ,同时 指定 一 个 最 小 支持 度 阔 值 。 序 列 模 式 挖掘 就 是 找 出 所 有 的 
频繁 子 序列 , 即 该 子 序列 在 序列 集中 的 出 现 频率 不 低 于 最 小 支持 度 阔 值 。 序 列 模式 挖掘 
的 主要 算法 有 GSP、PrefixSpan 等 。GSP(Generalized Sequential Patterns) 算 法 类 似 于 
Apriori 算法 ,PrefixSpan (Prefix-project Sequential Pattern mining) 算 法 采用 分 治 的 思 
想 , 不 断 产 生 序列 数据 库 的 多 个 更 小 的 投影 数据 库 , 然 后 在 各 个 投影 数据 库 上 进行 序列 模 
式 挖 据 。 序 列 模式 挖掘 是 数据 挖掘 一 个 重要 的 研究 领域 。 例 如 ,通过 对 Web 日 志 挖掘 可 
以 发 现 访问 规律 等 。 

不 同 的 数据 挖掘 方法 能 够 解决 不 同类 型 的 问题 。 表 6-1 是 部 分 数据 挖掘 算法 的 一 些 
典型 优点 和 缺点 。 数 据 挖掘 是 非常 活跃 的 研究 领域 , 表 中 的 评判 也 可 能 会 随 着 研究 的 进 
展 而 更 新 。 


表 6-1 数据 挖掘 算法 的 一 些 典 型 优点 和 缺点 
算 法 效 果 可 解释 性 可 操作 性 结果 产生 时 间 | 结果 可 视 化 


决策 树 好 非常 好 好 快 是 
聚 类 好 非常 好 好 快 是 
关联 规则 好 非常 好 好 慢 是 
神经 网 络 非常 好 不 好 不 好 慢 否 
Logistic 回归 好 非常 好 非常 好 快 榴 


不 同 的 算法 对 数据 有 不 同 的 结构 要 求 ,审计 人 员 实 践 中 往往 需要 根据 要 解决 的 具体 
问题 选择 合适 的 方法 。 例 如 ,如 果 是 分 类 问题 ,就 选用 分 类 方法 ;如 果 是 聚 类 问题 ,就 选用 
聚 类 方法 。 方 法 确定 后 ,再 根据 事例 属性 的 类 型 选用 合适 的 算法 。 例 如 ,在 回归 方法 中 ， 
如 果 输 出 属性 是 二 值 的 , 则 适合 选用 Logistic 回归 。 如 果 不 确定 使 用 哪个 算法 ,可 以 对 工 
有 具 中 的 候选 算法 进行 尝试 ,选择 挖掘 结果 最 好 的 算法 。 

例如 ,根据 审计 工作 方案 要 求 ,审计 组 要 对 S 省 商业 银行 贷款 5 级 分 类 的 真实 性 进行 
核实 。 主 要 问题 是 商业 银行 把 应 归于 不 良 的 贷款 划 归 正常 贷款 。 

贷款 5 级 分 类 即 正常 .关注 ,次 级 、 可 疑 和 损失 。 前 两 级 属于 正常 贷款 ,后 3 级 属于 不 
良 贷款 。 由 于 种 种 原因 , 某 些 事 实 上 的 不 良 贷款 被 商业 银行 划 归 为 正常 贷款 的 分 类 中 ,从 
而 掩盖 了 信贷 风险 。 

按照 通常 的 审计 思路 ,审计 人 员 需 要 解决 两 个 问题 : 一 是 通过 调查 ,学 习 该 省 银行 的 
5 级 分 类 规则 ;二 是 把 学 习 到 的 5 级 分 类 规则 应 用 到 全 省 每 一 笔 贷款 事例 中 ,核实 事例 是 
和 否 真 实 。 实 际 上 ,这 两 个 问题 都 很 难 解决 ,而 且 不 现实 。 


二 二 分 而 : 风 的 国 到 内 易 二 


一 个 新 的 思路 是 ,让 计算 机 自动 从 大 量 贷款 事例 中 学 习 到 5 级 分 类 规则 ,然后 应 用 该 
规则 核对 可 疑 贷款 事例 。 根 据 调 查 得 知 ,5 级 分 类 依据 主要 包含 两 个 方面 : 一 是 法 人 有 
关 属 性 ,如 经 营 状况 ,管理 特征 ;二 是 贷款 本 身 有 关 属 性 ,如 担保 方式 等 。 学 习 5 级 分 类 规 
则 如 图 6-2 所 示 。 


经 营 状况 | 管理 特征 ”| 担保 方式 | … 5 级 分 类 


NS ~ 六 | 
! 


6-2 学 习 5 级 分 类 规则 


根据 审计 目标 (对 S 省 商业 银行 5 级 分 类 真实 性 进行 核实 ) 和 数据 挖掘 途径 的 计算 机 
审计 的 一 般 过 程 模型 ,审计 人 员 现 在 能 够 提出 明确 的 业务 问题 : 通过 数据 挖掘 从 大 量 贷 
款 事例 中 发 现 分 类 规则 ,然后 确定 这 是 一 个 分 类 数据 挖掘 任务 。 对 于 分 类 数据 挖掘 任务 
的 过 程 是 : 首先 把 从 被 审 单位 采集 到 的 全 省 约 240 914 万 个 贷款 事例 分 成 两 个 集合 ,一 个 
是 可 信 事 例 集合 , 另 一 个 是 可 疑 事例 集合 。 审 计 人 员 在 可 信 事 例 集合 上 让 计算 机 自动 学 
习 5 级 分 类 规则 (当然 要 设置 从 哪些 列 中 学 习 ) ,再 把 此 规则 应 用 于 可 疑 事例 集 进 行 重 新 
分 类 ,然后 比较 新 分 类 和 原 分 类 有 无 不 同 。 两 个 分 类 不 同 的 贷款 事例 就 成 为 审计 重点 。 

下 面 选择 支持 分 类 的 算法 。 分 析 服 务 中 提供 了 Microsoft 决策 树 算法 。 

给 定 一 个 数据 集 , 让 分 析 服 务 根据 决策 树 算法 发 现 5 级 分 类 规则 是 首要 的 工作 ,该 工 
作 称 为 训练 ,用 来 进行 训练 的 数据 集 称 为 训练 集 。 将 发 现 的 规则 应 用 于 另外 一 个 数据 集 
从 而 发 现 问题 ,该 数据 集 称 为 预测 集 。 

训练 集 必须 真实 可 信 。 可 把 审计 年 度 发 放 且 已 经 到 期 的 .当前 归属 正常 和 关注 的 贷 
款 事例 作为 预测 集 ( 可 疑 事例 ), 其 余 事例 作为 训练 集 ( 可 信 事 例 )。 根 据 从 可 信 事 例 集 中 
学 习 到 的 5 级 分 类 规则 对 可 疑 事例 集 重新 分 类 ,重新 分 类 后 的 类 标签 与 原来 的 类 标签 不 
一 致 的 贷款 事例 就 称 为 疑点 。 

关联 规则 算法 检测 具有 类 似 购物 事务 中 的 隐藏 的 物品 间 的 规则 。 简 单 地 说 ,一 条 规 
则 就 是 一 个 “如 果 … 那 么 … ”语句 。 出 现在 一 个 事务 中 的 物品 称 为 “项 (item)”, 一 个 事务 
中 的 若干 个 物品 称 为 “项 集 (itemset)”。 

在 关联 规则 中 ,支持 度 和 可 信和 度 能 够 比较 直接 地 形容 关联 规则 的 性 质 。 任 意 给 出 事 
例 中 的 两 个 项 集 ,它们 之 间 都 存在 关联 规则 ,只 不 过 程度 有 所 不 同 。 如 果 不 考虑 关联 规则 
的 支持 度 和 可 信和 度 ,那么 在 事务 数据 库 中 可 以 发 现 无 穷 多 的 关联 规则 。 事 实 上 ,人 们 一 般 
只 对 满足 一 定 的 支持 度 和 可 信 度 的 关联 规则 感 兴趣 。 因 此 ,为 了 发 现 有 意义 的 关联 规则 ， 
需要 给 定 两 个 国 值 : 最 小 支持 度 和 最 小 可 信和 度 ,前 者 规定 了 关联 规则 必须 满足 的 最 小 支 
持 度 ;后 者 规定 了 关联 规则 必须 满足 的 最 小 可 信和 度 。 一 般 称 满足 一 定 要 求 ( 如 较 大 的 支持 
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度 和 可 信 度 ) 的 规则 为 强 规则 (strong rules) 。 

在 关联 规则 的 挖掘 中 要 做 好 数据 准备 工作 。 数 据 准备 将 直接 影响 到 问题 的 复杂 度 
及 目标 的 实现 。 另 外 ,注意 选取 恰当 的 最 小 支持 度 和 最 小 可 信和 度 。 这 依赖 于 用 户 对 目 
标的 估计 ,如 果 取 值 过 小 ,会 发 现 大 量 无 用 的 规则 ;如 果 取 值 过 大 ,又 有 可 能 找 不 到 
规则 。 

数据 挖掘 工具 能 够 发 现 满足 条 件 的 关联 规则 ,但 它 不 能 判定 关联 规则 的 实际 意义 。 
对 关联 规则 的 理解 ,仍然 需要 熟悉 业务 背景 。 在 发 现 的 关联 规则 中 ,可 能 有 两 个 主观 上 认 
为 没有 多 大 关系 的 项 ,它们 的 关联 规则 支持 度 和 可 信 度 却 很 高 ,需要 根据 业务 知识 、 经 验 ， 
从 各 个 角度 判断 这 是 一 个 偶然 现象 或 有 其 内 在 的 合理 性 ;反之 ,可 能 有 主观 上 认为 关系 密 
切 的 项 ,结果 却 显示 它们 之 间 关 联 不 强 。 

例如 ,审计 人 员 可 以 通过 挖掘 医保 报销 数据 中 的 用 药 规则 ,检测 出 不 符合 规则 的 “ 假 
住院 ”审计 疑点 。 

在 Microsoft SQL Server 企业 管理 器 中 建立 查询 ,选择 医疗 机 构 H000 和 H001 报销 事 
例 进行 学 习 。 使 用 报销 单据 主 表 和 入 院 登 记 表 建立 视图 VEXAMPLE。SQL 语句 如 下 。 


CREATE VIEW VEXAMPIES 
Rs 

SEIECT 医 疗 机 构 码 ,住院 序号 ,住院 诊断 码 ,诊断 码 ,单据 号 ,单据 发 生日 期 , 金额 
FERCM 报销 单据 主 表 as B JON 人 院 登记 as R CN B. 住 院 序号 =R. 住 院 序号 

WHERE R. 医 疗 机构 代 码 IN ("HO00', 'H001') AND R. 诊 断 码 is not null 


准备 冠 心病 住院 事例 以 及 消费 明细 : 


CREATE VIEW VEXAMPLESGXBHOOOHOOl 

RS 

SELECT 医疗 机 构 码 + 住院 序号 as 住院 号 , 单据 号 
ERCM VEXRMEIFS 

WHERE 住院 诊断 码 = '6703" 


其 中 ,“6703” 是 和 冠 心病 的 诊断 码 。 
从 报销 单 明细 表 中 筛选 这 两 家 医疗 机 构 的 住院 报销 明细 ,发 现 这 两 家 医院 的 冠 心病 
报销 有 1 173 355 条 记录 。 


CREATE VIEN VDETAILS 
RS 

SETIRCT 医 疗 机 构 代码 , 医疗 机 构 代 码 + 单据 号 zs 单据 号 ,项目 名 称 ,单价 ,数量 
FECM dbo. 报 销 单 明 细 表 

WHERE 医疗 机 构 代 码 IN ("H000' 'H001') 


以 冠 心病 住院 为 事例 ,通过 报销 单据 把 住院 事例 和 消费 明细 进行 连接 ,创建 用 于 关联 
规则 分 析 的 视图 。 


CREATE VIEW VASSGXBHOOOHOOl]ZY 
RS 
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SETECT M. 住 院 号 , D. 项 目 名称 AS 项 目 

FROM VEXAMPTFESGXBHO00H001 Rs M JOIN VDETAILS AS D ON M. 单 据 号 =D. 单 据 号 

至 此 ,用 于 冠 心 病 消费 项 目 关联 规则 分 析 的 数据 结构 和 数据 已 经 准备 完毕 。 

启动 SQL Server 数据 库 服务 和 分 析 服 务 ,在 Excel 中 选择 “数据 ?功能 区 , 单 击 “ 获 取 
外 部 数据 ”, 然 后 单 击 “ 自 其 他 来 源 ”“ 来 自 SQL Server”。 在 接 下 来 打开 的 “数据 连接 向 
导 ” 中 输入 数据 库 服 务 器 的 名 字 ,保持 默认 的 登录 凭据 不 变 。 

接 下 来 按照 向 导 指 示 , 从 数据 库 中 选择 “VASSGXBH000H001ZY” 视 图 作为 数据 源 
导入 到 Excel sheetl 中 并 作为 一 个 表 。 把 sheetl 改名 为 “H000H001 冠 心 病 ”。 

Excel 的 关联 规则 要 求 数据 必须 按照 事务 ID 排序 。 所 以 ,在 “数据 ”功能 区 , 单 击 “ 排 
序 ”, 设 置 事务 ID 按照 升序 排序 。 

然后 从 Excel 中 选择 “数据 挖掘 ?功能 区 , 单 击 “ 关 联 ”, 弹 出 关联 规则 数据 挖掘 向 导 。 
一 般 保持 默认 选项 : 选择 “H000H001 冠 心病 ”工作 单 中 的 “VASSGXBH000H001ZY” 表 
作为 数据 源 。 

在 接 下 来 的 设置 中 ,Excel 已 经 聪明 地 识别 出 “住院 号 ”是 关联 规则 算法 中 的 事务 标 
识 (ID) ,项 目 是 关联 规则 算法 中 的 “项 *”。 如 图 6-3 所 示 ,在 “ 阔 值 设置 中 “最低 支持 等 
于 10” 的 意思 是 包含 某 个 项 集 的 事务 至 少 有 10 个 ;* 最 小 规则 概率 二 40%” 的 意思 是 某 
个 关联 规则 的 可 能 性 。 例 如 ,如 果 冠 心病 病人 吃 A 药 , 那 么 他 也 吃 B 药 的 可 能 性 
是 40%。 

保持 默认 设置 不 变 , 单 击 * 下 一 步 ?按钮 ,如 图 6-3 所 示 。 


关联 


选择 中 多 行 标识 事务 的 列 和 包含 希望 查找 关联 性 的 项 的 列 。 数 据 应 按 事务 ID 排序 。 


事务 ID(D: 
项 (D: 
团 值 


最 低 支持 (2D : 10 图 回 百分比 (四 图 项 (3) 
景 小 规则 概率 (B) : 


[ES 


图 6-3 关联 


把 “模型 名 称 ” 改 为 “ 冠 心病 消费 项 目 关联 分 析 ”, 单 击 “ 完 成 "按钮 。Excel 开始 调用 分 析 
服务 的 关联 规则 算法 对 Excel 表 中 的 数据 进行 学 习 。 这 个 过 程 可 能 会 持续 较 长 时 间 。 

Excel 学 习 结束 后 ,自动 弹出 “浏览 "对话 框 ,显示 学 习 的 结果 。 其 中 , “规则 ”选项 卡 
列 出 了 学 习 到 的 所 有 规则 ,如 图 6-4 所 示 。 例 如 ,规则 “ 泵 -二 导管 秆 人 套件 ”的 意思 是 ,如 
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果 治 疗 中 使 用 了 “ 泵 ”, 那 么 也 会 使 用 “导管 置 人 套件 ”。 该 规则 的 概率 是 0. 893 ,重要 性 是 
1. 637。 如 果 重 要 性 为 0, 则 表示 两 个 项 目 毫 无 关联 。 重 要 性 就 是 在 不 使 用 “导管 置 人 套 
件 ” 情 况 下 使 用 “ 泵 ”的 概率 去 除 该 规则 的 概率 。 重 要 性 的 值 越 大 ,说 明 当 使 用 “ 泵 ”时 ,使 
用 “导管 置信 套件 ”的 可 信和 度 越 高 。 

可 以 根据 需要 设置 第 选 满足 “最 小 概率 ”和 “最 低 重要 性 ”的 规则 。 图 6-4 显示 了 概率 
大 于 或 等 于 0. 8, 重 要 性 大 于 或 等 于 0.6 的 所 有 规则 。 


规则 | 项 集 |[ 信 问 关 系 网 络 


最 小 概率 : 0-a0 司 第 选 规则 : 和 

最 低 重 要 性 : 恋 65 未: [区 显示 属性 名 称 

回 显示 长 名 称 最 大 行 数 : zo00 图 

。 概率 规则 <^ 
el 耳 纤 维 内 家 镇 检查 -》 纤维 员 别名 检 


检查 
信守 (的 4 六 直 ) 况 和 这 洁 -> 抗 双 链 | 司 
Ey -》 乙 腔 丁 | 
部 A 超 -> Rom 


el A leh -> 锝 [ 
光 血清 泌乳 素 测 定 北 学 发 > 
> 火 麻 仁 (复方 ) 
贡 肯 上 上 委 友 拓 六 并 主 化 学 血清 促 卵泡 刺 ; 
0. 857 . 血清 促 肾 上 了 腺 皮质 激素 测定 > 血清 促 黄体 生 F 


0.833 | 肺 通气 显 象 (每 增加 一 个 体位 加 收 ) -》 锝 [99mTc] 聚 全 
灌注 tt -》 锝 [99nTc] 聚 合 E 


规则 ; 1122 


复制 到 Excel (E) 关闭 (C) 


图 6-4 浏览 规则 


“项 集 ” 选 项 卡 显 示 了 满足 最 低 支持 和 最 小 项 集 大 小 的 项 集 列表 ,如 图 6-5 所 示 。 例 
如 ,“ 住 院 诊 查 费 ” 项 集 的 大 小 是 1, 即 该 项 集中 只 有 一 个 项 目 ; 项 集 的 支持 度 是 374, 意 思 
是 有 374 个 住院 事例 中 有 该 消费 项 目 。 

“依赖 关系 网 络 ” 展 示 了 消费 项 目 之 间 的 依赖 关系 。 通 过 上 下 拖 动 左 侧 的 滚动 条 ,可 
以 调节 依赖 的 弱 强 , 从 而 增加 或 者 减少 途中 箭头 的 数目 ,便于 观察 。 单 击 某 个 项 目 ,可 以 
通过 颜色 显示 与 其 相关 的 项 目 。 

回 到 “规则 ?选项 卡 , 单 击 左下 角 的 “复制 到 Excel” 按 钮 ,把 所 有 满足 条 件 的 规则 复制 
到 Excel 中 。 在 “规则 ?工作 单 上 单 击 * 规 则 ”上 面 的 筛选 按钮 ,设置 筛选 “包含 “ 泵 ”的 规 
则 ,结果 如 图 6-6 所 示 。 

把 医疗 机 构 H002 作为 预测 集 , 首 先 按照 类 似 的 做 法 创建 视图 VASSGXBH002, 整 
理 出 H002 的 冠 心病 所 有 住院 事例 (326 个 冠 心病 ) 和 消费 项 目 , 应 用 如 下 SQL 语句 ,查询 
无 “住院 诊 查 费 ”的 住院 事例 ,找到 19 个 。 

SETECT distinct 住院 序号 

FROM VASSGXBHO02 

except 
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算 选 项 集 : 
显示 


| 回 旺 示 长 名 称 
_ 大 小 “项 集 

在 院 诊 间 桥 

毅 及 输液 

一 次 性 注射 器 

前 本 梳 

一 次 性 给 液 器 〈 欠 流标 及 专用 管 ) 

一 次 性 采血 器 


静脉 输液 《 自 第 二 瓶 起 每 瓶 收 》 

四 测定 高 子 选择 电极 法 

趣 测 定 火焰 分 光 光 度 法 或 高 子 选择 电极 法 
钠 测定 火炮 分 光 光度 法 或 高 子 选择 电极 法 
肌 醋 测定 酶 促 动力 学 法 

血清 尿酸 测定 

尿素 测定 酶 促 动力 学 法 

血清 总 蛋白 测定 化 学 法 

血渍 着 明 汁 酶 测定 酶 但 注 


图 6-5 项 集 


wHERE 项目 = "住院 诊 查 费 ， 
然后 ,在 这 19 个 住院 事例 中 应 用 关联 规则 。 例 如 ,从 无 住院 诊 查 费 的 事例 XXXXXXXX 


CH002 的 住院 号 ) 的 消费 项 目 中 发 现 其 使 用 了 “ 泵 ”, 根 据 关联 规则 : 泵 -二 支架 (介入 ) 、 泵 -二 
导管 等 ,发 现 该 住院 事例 不 满足 条 件 ,因此 审计 人 员 将 此 次 住院 列 为 疑点 。 


CC / as 


Co 


大 数据 分 析 


7.1 大 数 据 


当 数据 集 的 规模 超出 传统 数据 库 软件 的 管理 和 分 析 能 力 , 通 常 达 到 几 十 TB, 甚 至 几 
个 PB 规模 时 ,被 称 为 “大 数据 ?。 一 般 来 说 ,超大 规模 数据 是 指 千 兆 字 节 GB(1GB= 
1024MB) 级 的 数据 ;海量 数据 是 指 万 亿 字 节 或 者 太 字 节 TB(1TB==1024GB) 级 的 数据 ;大 
数据 则 是 指 千 万 亿 字 节 或 拍 字 节 PB(1PB 二 1024TB) 级 及 其 以 上 (EB、ZB 和 YB) 的 数据 。 

大 数据 有 3 个 基本 特征 : 体 量 (volume) 大 ,流动 快 (velocity) 和 多 样 性 (variety)。 随 
着 物 联网 技术 、 互 联网 技术 不 断 深入 到 人 类 社会 的 各 个 角落 ,人 类 的 社会 活动 ,无 论 是 步 
行 过 马路 ,还 是 驾车 过 道口 ;无 论 使 用 社交 软件 聊天 ,还 是 网 上 浏览 购物 ;无 论 使 用 网 约 车 
出 行 ,还 是 到 外 地 住宿 餐饮 ,都 被 以 各 种 各 样 形式 记录 在 某 个 存储 器 中 ,从 而 累积 成 大 
数据 。 

数据 可 分 为 3 大 类 : 文本 、 音 频 和 视频 。 从 结构 角度 看 ,对 数据 的 组 织 有 结构 化 、 半 
结构 化 和 无 结构 3 大 类 。 关 系数 据 库 就 是 典型 的 以 结构 化 方式 管理 数据 。Excel 也 是 以 
结构 化 方式 管理 数据 。 从 数据 项 之 间 的 前 驱 、 后 继 关 系 划分 ,数据 结构 可 分 为 线性 表 、 树 
和 图 。 网 页 (Web page) 是 典型 的 半 结 构 化 数据 ,这 种 形式 允许 数据 模式 (schema) 动 态 变 
化 。 超 文本 标记 语言 (eXtensive Markup Language, XML) 描 述 的 数据 也 是 半 结 构 化 的 。 
一 个 文本 文件 (. txt 文件 ) 仅 是 字符 的 集合 ,一般 认为 是 无 结构 的 。 

大 数据 不 仅 带 来 了 数据 资产 ,更 重要 的 是 改变 了 思维 方式 。 

首先 的 变革 是 大 数据 允许 直接 在 总 体 上 进行 计算 ,而 不 必 采 样 。 当 总 体 的 数据 不 可 
得 ,或 者 获得 的 代价 无 法 承受 时 ,只 有 使 用 采样 技术 ,使 用 样本 的 统计 量 去 估计 总 体 的 参 
数 。 大 数据 不 仅 在 数据 采集 上 得 到 了 总 体 数据 ,而 且 在 存储 和 计算 上 都 提供 了 解决 方案 。 
但 是 ,这 并 不 意味 着 采样 和 估计 失去 了 价值 。 某 高 校 曾 应 用 学 生食 堂 就 餐 的 大 数据 遂 选 
贫困 生 , 但 是 结果 并 不 准确 。 所 以 ,大 数据 只 是 提供 了 解决 问题 的 一 种 视角 ,但 不 是 唯 
一 的 。 

其 次 ,关注 相关 .不必 关 注 因果 。 人 类 认识 世界 ,首先 想 知道 “是 什么 ”, 在 此 基础 上 接 
着 想 知道 为什么”, 这 就 是 追求 因果 : 什么 原因 导致 什么 结果 。 人 们 要 么 从 结果 中 追溯 
原因 ,要 么 从 原因 演绎 结果 。 电 视 剧 ( 康 照 王朝) 中 有 一 个 情节 : 康 照 小时候 得 了 天 花 , 苏 
麻 喇 寻 采 来 “ 茂 茂 草 ”, 结 果 康 申 服 用 7 天 后 病 愈 了 。 那 么 “ 茂 茂 草 ”" 和 “治疗 天 花 ” 之 间 有 


审 动 分 析 : 从 关系 到 大 数 所 


因果 关系 吗 ? 恐怕 这 个 问题 很 难 回 答 ;但 是 如 果 问 ,“ 茂 茂 草 ”" 和 “治疗 天 花 " 之 间 相 关 吗 ? 
那么 回答 起 来 似乎 容易 一 些 。 大 数据 使 得 人 们 能 够 意识 到 许多 以 前 并 没有 意识 到 的 联系 
的 存在 。 这 里 的 相关 关系 不 完全 是 线性 相关 ,应 该 是 一 种 联系 。 究 竞 以 什么 样 的 函数 表 
达 这 种 联系 ,大 数据 的 应 用 并 不 关心 。 一 旦 完成 了 大 数据 相关 关系 分 析 , 而 又 不 满足 于 仅 
仅 知 道 “ 是 什么 ”, 自 然 会 继续 研究 “因果 关系 ”。 因 果 关 系 是 一 种 特殊 的 相关 关系 。 

还 有 ,大 数据 基础 上 的 简单 算法 比 小 数据 基础 上 的 复杂 算法 更 加 有 效 。 例 如 ,谷歌 使 
用 了 不 同 语言 翻译 的 质量 参差 不 齐 的 数 十 亿 对 译文 档 作 为 语料库 训练 其 翻译 系统 ,这 些 
文档 包括 企业 官方 的 不 同 语言 版 本 的 主页 以 及 国际 组 织 发 布 的 官方 报告 的 不 同 语言 版 
本 ,不 进行 过 滤 , 保 留 不 完整 的 句子 ,语法 错误 、 拼 写 错误 等 ,也 不 用 人 工 进行 注解 。 庞 大 
而 复杂 的 语 料 反而 使 得 谷歌 翻译 系统 的 质量 得 到 了 提升 。 


7.2 大 数据 审计 分 析 


大 数据 为 审计 提供 了 全 覆盖 的 机 遇 , 也 提出 了 新 的 挑战 : 如 何 从 大 体 量 的 ,纷繁 复杂 
的 经 济 活动 中 发 现 审 计 疑 点 和 审计 线索 。 例 如 ,如 何 从 海量 贷款 示例 中 查找 出 异常 贷款 ? 

“ 自 顶 向 下 、 逐 层 细 化 ?是 基于 大 数据 审计 分 析 的 一 种 策略 。 也 就 是 先 把 握 总 体 ; 然 后 
发 现 疑点 , 即 找到 突破 口 ;最 后 定位 事项 ,分 散 核实 ,归结 证 据 。 

把 握 整 体 就 是 借助 可 视 化 的 数据 分 析 工 具 选 取 关 键 的 业务 ,财务 特征 ,以 二 维 或 多 维 
形式 ,对 被 审计 数据 进行 多 维度 可 视 化 分 析 ,观测 被 审计 数据 在 时 间 、 空 间 上 的 分 布 以 及 
变化 趋势 ;比较 同比 、 环 比 的 变化 ,发 现 大 的 波动 ,确定 主题 ,在 整体 和 宏观 层面 上 通过 观 
察 发 现 规律 ,寻找 异常 。 

把 不 同 部 门 的 不 同 主题 的 数据 关联 起 来 、 使 用 适当 的 特征 ,利用 数据 挖掘 技术 发 现 
疑点 。 

根据 疑点 逐一 分 散 调查 取证 ,进行 核实 。 

例如 , 某 审 计 机 关 在 农村 危房 改造 专项 资金 审计 中 首先 采集 住 建 , 财 政 、 房 产 、 民 政 、 
车 管 ,扶贫 、 新 农 合 等 单位 的 数据 ,从 “ 危 改 户 收 入 是 否 超 标 ” 这 个 角度 出 发 ,对 建 档 立 卡 、 
工商 登记 、 财 政 供养 ,车辆 ,房产 .公积金 等 多 部 门 数据 进行 关联 分 析 , 从 危 改 户 个 人 维度 、 
家 庭 成 员 维度 等 多 个 维度 观察 数据 ,建立 宏观 认识 。 

然后 围绕 危房 改造 专项 资金 的 供应 和 管理 ,以 资金 拨付 、 资 金 使 用 效益 、 危 改 政策 落 
实 以 及 危 改 工程 推进 等 为 基础 ,对 采集 到 的 多 部 门 数据 进行 跨年度 、 跨 领域 关联 比 对 分 
析 , 从 资金 领取 年 度 、 家 庭 成 员 、 人 员 类 别 、 人 员 身 份 等 多 维度 进行 数据 挖掘 ,发 现 异常 事 
例 , 通 过 钻 取 等 操作 快速 锁定 审计 疑点 。 

最 后 是 入 户 调查 ,扎实 排查 疑点 。 对 于 锁定 的 审计 疑点 进行 有 针对 性 的 入 户 调查 ,重点 
审查 重复 享受 危 改 补助 .克扣 截留 补助 以 收取 其 他 费用 名 义 索 要 回扣 等 问题 。 全 面 排查 疑 
点 对 象 的 个 人 申报 资料 、 危 改 资金 银行 账户 、 村 委 证 明 、 公 示 材 料 , 危 房 鉴 定 书 、 验 收 档案 等 ， 
并 深入 了 解 五 保 户 、 低 保 户 、 残 疾 人 及 其 他 贫困 人 员 享 受 危 改 政策 情况 ,归结 证 据 。 

基于 大 数据 计算 机 审计 的 过 程 包 括 : 采集 、 信 息 抽取 和 清理 数据 集成 、 建 模 和 分 析 ， 
以 及 解释 和 部 署 。 在 不 影响 对 审计 线索 发 现 的 条 件 下 ,往往 需要 按照 一 定 比 例 筛 选 和 压 


EA 


缩 原始 数据 。 应 妥善 定义 筛选 条 件 ,使 得 不 会 抛弃 有 用 的 数据 ;收集 到 的 数据 格式 往往 不 
满足 实际 需要 ,应 按照 一 定 的 抽取 流程 把 所 需 的 信息 从 底层 数据 源 抽取 出 来 ,然后 再 以 适 
于 分 析 的 结构 化 形式 呈现 。 有 效 的 大 规模 分 析 往 往 需要 从 多 个 数据 源 收 集 异 质数 据 。 例 
如 ,在 整合 和 分 析 医 疗 健康 记录 的 同时 ,可 以 利用 通过 互联 网 获取 的 环境 数据 。 数 据 转 换 
和 集成 工具 集 帮 助 审 计 师 解决 数据 结构 和 语义 上 的 异 质 性 问题 。 大 数据 分 析 方法 与 传统 
的 小 样本 统计 分 析 方 法 存在 根本 区 别 。 噪 声 动态. 异 质 性 .相关 性 和 不 可 靠 比 小 样本 更 
有 价值 ,综合 统计 结果 通常 不 仅 能 克服 个 体 数 据 的 抖动 和 偏差 ,还 能 揭示 更 可 靠 的 隐藏 的 
知识 。 审 计 师 必须 认真 审视 在 多 个 分 析 阶 段 中 做 出 的 各 种 假设 ,对 大 数据 分 析 结果 进行 
合理 的 解释 。 


7.3 大 数据 可 视 化 


人 们 的 决策 可 分 为 两 种 : 理性 的 (rational) 和 非 理 性 (Cirrational) 的。 所 谓 “ 理 性 ”, 指 
符合 某 种 逻辑 推演 ;所 谓 * 非 理性 ”, 指 无 法 用 一 种 迎 辑 进行 解释 。 例 如 , 雾 者 天 气 , 许 多 人 
出 门 都 戴 上 了 PM2. 5 口 单 , 这 就 是 一 种 理性 的 决策 ;又 如 ,在 青年 偶像 剧 中 经 常会 听 到 这 
样 的 对 白 :“ 我 就 是 喜欢 他 (她 )”。 这 就 是 一 种 非 理 性 的 决策 。 人 类 的 决策 很 多 情况 下 是 
靠 * 直 觉 ” 完 成 的 ,这 种 “直觉 ?也 是 非 理 性 的 ,但 是 ,直觉 往往 是 正确 的 。 

直觉 从 哪里 来 ? 从 人 的 感知 来 。 在 视觉 .听觉 .触觉 .嗅觉 .味觉 等 感知 途径 中 ,视觉 
是 最 主要 的 ,通过 视觉 接收 的 信息 不 仅 多 ,而 且 快 。 为 什么 用 人 单位 招聘 一 定 要 有 “面试 ” 
环节 呢 ? 这 就 是 期 望 通过 视觉 捕 提 更 多 的 信息 ,以 便 决 策 。 

大 数据 的 体 量 大 使 得 我 们 无 法 在 “明细 ?的 级 别 上 逐条 阅读 和 审核 数据 ,我 们 希望 在 
不 同 “ 粒 度 ”(granularity) 或 者 “尺度 ”(scale) 上 观察 数据 ;大 数据 的 流量 快 也 使 得 我 们 无 
法 及 时 捕捉 数据 中 的 特征 .关联 ,变化 模式 。 可 视 化 是 把 信息 传递 给 人 类 的 有 效 途 径 之 
一 。 可 视 化 指使 用 不 同形 状 , 大小、 颜色 位置. 方向 .姿态 .亮度 . 灰 度 .背景 .场景 等 视觉 
元 素 表达 数据 中 隐 含 的 语义 。 

图 7-1 展示 了 一 个 可 视 化 例子 。 数 据 来 自 * 河 北 人 才 网 ?的 招聘 求职 信息 。 把 某 个 时 
间 区 间 的 招聘 信息 中 关于 岗位 要 求 的 文字 描述 全 部 提取 出 来 ,分 词 后 统计 词 频 , 并 使 用 及 
的 词 云 包 制作 。 

该 图 使 用 了 颜色 、 字 号 和 位 置 展现 不 同 词汇 的 频率 。 词 频 越 高 ,字号 越 大 ,位 置 越 居 
中 。 从 图 7-1 中 可 以 迅速 获取 信息 : 企业 招聘 最 关心 两 件 事 ,一 是 经 验 ; 二 是 能 力 。 

图 7-2 展示 了 计算 机 专业 求职 者 与 数学 专业 求职 者 的 数量 随 年 龄 的 变化 情况 。 很 快 
能 够 发 现 ,两 个 专业 的 求职 者 年 龄 分 布 不 同 ,计算 机 类 在 29 岁 出 现 求职 高 峰 , 并 且 计 算 机 
类 在 35 岁 还 出 现 小 高 峰 ;而 数学 类 求职 者 在 27 岁 。 

研究 生 毕 业 一 般 在 27 岁 。 求 职高 峰 与 学 历 相关 吗 ? 有 因果 吗 ? 这 是 值得 进一步 探 
究 的 问题 。 

一 般 来 说 ,人 们 在 看 到 一 个 折线 图 、 饼 图 或 者 条 形 图 时 ,容易 迅速 发 现 变 化 趋势 或 者 
特征 。 这 对 于 决策 特别 重要 ,但 要 根据 数据 的 时 间 、 空 间 等 特点 设计 合适 的 可 视 化 形式 ， 
如 统计 图 (chart) .图 (diagram) 图形 (graph) 、 地 图 (map) 动画 (animation) 等 。 数 据 可 视 
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化 的 目的 是 帮助 人 们 理解 数据 ,对 数据 有 全 面 的 或 者 本 质 的 认 知 。 

Excel 透视 图 在 数据 集 上 创建 二 维 或 者 三 维 图 形 。 通 过 观察 这 些 图 形 , 从 而 发 现 那 
些 隐藏 的 事先 未 知 的 和 可 能 有 用 的 信息 或 模式 。 散 点 图 、 折 线 图 、 柱 形 图 和 饼 图 可 以 实 
现 从 多 维 角度 观察 数据 ; 树 形 图 从 层次 角度 观察 数据 。 

柱 形 图 用 来 分 析 连 续 量 在 离散 量 上 的 比较 ,如 税额 在 税务 机 关上 的 比较 。 离 散 量 (如 
税务 机 关 ) 安 排 在 横 坐 标 轴 上 ,连续 量 (如 税额 ) 的 汇总 安排 在 纵 坐 标 轴 上 。 

柱 形 图 共有 7 种 子 图 表 类 型 : 簇 状 柱 形 图 .堆积 柱 形 图 ,百分比 堆积 柱 形 图 、 三 维 艇 
状 柱 形 图 三维 堆积 柱 形 图 .三维 百分比 堆积 柱 形 图 和 三 维 柱 形 图 。 其 中 , 簇 状 柱 形 图 是 
柱 形 图 的 基本 类 型 。 


挟 口 霹 风 贸 阳 分 于 


折线 图 用 来 显示 一 系列 数据 在 离散 字段 和 时 间 上 的 变化 趋势 。 这 些 趋 势 包括 : 递 
增 .递减 , 增 减 的 速率 , 增 减 的 规律 (如 周期 性 、 螺 旋 性 等 ) ,峰值 等 。 折 线 图 也 可 用 来 分 析 
多 组 数据 随时 间 变 化 的 相互 作用 和 相互 影响 。 在 折线 图 中 ,一 般 水 平 轴 (X 轴 ) 用 来 表示 
时 间 的 推移 ,并 且 间 隔 相 同 ; 而 垂直 轴 (Y 轴 ) 代 表 不 同时 刻 的 数据 的 大 小 。 折 线 图 共有 7 
个 子 图 表 类 型 : 折线 图 .堆积 折线 图 百分比 堆积 折线 图 、 数 据点 折线 图 .堆积 数据 点 折线 
图 、 百 分 比 堆积 数据 点 折线 图 和 三 维 折线 图 。 

例如 ,通过 折线 图 比较 各 税务 机 关 在 2002 年 .2013 年 .2004 年 延期 纳税 批准 额 的 趋 
势 。 延 期 纳税 批准 额 初始 状态 如 图 7-3 所 示 。 
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图 7-3 延期 纳税 批准 额 初始 状态 


右 击 数据 透视 图 区 域 ,选择 “更 改 图 表 类 型 ,在 “图 标 类 型 ?对话 框 中 选择 “折线 图 ”， 
单 击 “ 确 定 ” 按 钮 ,结果 如 图 7-4 所 示 。 

观察 折线 的 形状 可 以 发 现 ,N 区 国家 税务 局 批准 延期 纳税 额 的 力度 在 2013 年 变化 明 
显 ;G 区 、L 区 和 NN 区 的 延期 纳税 批准 额 在 3 年 间 均 高 于 其 他 税务 机 关 。 

饼 图 通常 用 来 描述 比例 ,构成 等 信息 。 

饼 图 共有 6 个 子 图 表 类 型 : 饼 图 .三维 饼 图 、 复 合 饼 图 、 分 离 型 饼 图 、 分 离 型 三 维 饼 图 
和 复合 条 饼 图 。 其 中 ,复合 饼 图 和 复合 条 饼 图 是 在 主 饼 图 的 一 侧 生成 一 个 较 小 的 饼 图 或 
堆积 条 形 图 ,用 来 将 其 中 一 个 较 小 的 扇形 中 的 比例 数据 放大 表示 。 

例如 ,通过 饼 图 观察 各 税务 机 关 对 2013 年 总 延期 纳税 额 的 贡献 程度 。 

首先 在 Excel 数据 透视 表 的 “ 列 标签 "中 设置 筛选 : 2013 年 。 然 后 在 数据 透视 图 上 右 
击 , 选 择 “ 更 改 系 列 图 表 类 型 ”在 “图 标 类 型 ”对话 框 中 选择 “ 饼 图 ”, 单 击 “ 确 定 ” 按 钮 ,出 现 
7-5。 

很 快 看 到 ,N 区 国家 税务 局 贡献 最 大 。 把 鼠标 指针 停留 在 N 区 国家 税务 局 上 ,出 现 
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图 7-5 饼 图 


黄色 的 提示 信息 : 系列 “2013? 引 用 *N 区 国家 税务 局 "数值: 473324780. 7(30%)。 这 里 
的 30% 值 占 总 数 的 30%。 

当 遇 到 以 下 情形 时 ,尤其 需要 数据 可 视 化 : 数据 的 底层 结构 相同 ,并 可 以 归 类 ;数据 
的 领域 性 太 强 , 跨 领域 理解 的 难度 大 ;数据 的 时 间 和 空间 跨度 大 ,等 等 。 
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7-6 展示 了 2018 年 2 月 11 日 13 时 38 分 22 秒 时 石家庄 市 的 交通 状态 ,该 图 片 使 
用 百度 地 图 获得 。 


图 7-6 城市 交通 状 


从 图 7-6 中 可 以 看 到 ,拥堵 路 段 出 现在 二 环 路 上 ,主要 有 3 处 : 西 二 环北 段 . 东 二 环 中 
段 和 东北 二 环 。 南 二 环 通 往 石家庄 站 也 有 局 部 拥堵 。 注 意 ,2018 年 2 月 11 日 是 农历 腊 
月 廿 六 ,距离 中 国 传统 的 重要 节日 一 一 春节 只 有 一 周 的 时 间 。 地 图 数据 和 交通 数据 都 是 
专业 性 很 强 的 数据 ,但 机 动车 驾驶 人 不 必 关 心 数据 的 底层 细节 ,能 读 懂 交 通 状 态 即 可 。 

大 卫 ' 麦克 坎 德 菜 斯 说 ,“ 可 视 化 是 压缩 知识 的 一 种 方式 ”所 以 ,可 视 化 的 结果 是 有 
帮助 的 ,但 是 ,可 视 化 的 过 程 并 不 轻松 。 可 视 化 需要 的 技术 包括 : 数据 的 清洗 和 变换 、 文 
本 标记 、 集 成 多 个 数据 源 的 数据 ,集成 数据 挖掘 ,集成 知识 表示 和 推理 技术 以 及 实现 普 适 
性 等 。 
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